Initiation à la datascience – formation prise en charge par votre CPF

Initiation à la datascience – formation prise en charge par votre CPF
Initiation à la datascience – formation prise en charge par votre CPF
13 septembre 2021
Jour complet
Toulon

toulon

1320 euros TTC

Anne Marie Richier

0623803102

Courriel

Site web de l'événement

Fin de l'événement : 14 septembre 2021

La datascience, ou science de la donnée permet aux entreprises de connaitre des tendances grâce  aux analyses des gros volumes de données. Les informations obtenues sont exploitées comme des aides à la décision. L’une des richesses des entreprises est leur data, qu’elle doivent exploiter. Les data scientist dont des experts de la donnée de plus en plus recherchés.

La formation vous donne les bases du métier.

Il n’y a pas de prérequis mais une forte appétence en mathématiques est demandée.

 

Partie 1 

Objectifs : Comprendre les enjeux et interactions avec les autres métiers et se familiariser avec l’environnement technique

  • A QUOI SERT LA DATA SCIENCE

Définition et rôle du Data Scientist • Panel de projets Data Science • Principaux concepts data

  • MISE EN PLACE DE L’ENVIRONNEMENT TECHNIQUE

Python, Jupyter, Scikit-Learn et Pandas • Clonage du repo et récupération des notebooks • Définition de la problématique posée : prédire combien un client va dépenser sur un site e-commerce durant la 1ere année • Roadmap projet

  • ANALYSE SIMPLE DE DONNÉES

La donnée : format, nature et structure • Définition d’un ordre de grandeur • Notion d’échantillon et diversité • Présentation d’un 1er modèle abstrait et familiarisation avec les principaux concepts et le vocabulaire

  • MODÈLE ABSTRAIT ET FAMILIARISATION AVEC LE MACHINE LEARNING

Qu’est-ce qu’un modèle mathématique ? • Distinction entre apprentissage supervisé et apprentissage non supervisé

Partie 2 

Objectifs : Maîtriser le vocabulaire  et implémenter un modèle apprenant

  • MODÈLE LINÉAIRE À 2 VARIABLES POUR LA CLASSIFICATION

Solutions analytiques vs solutions stochastiques • Qu’est ce que la linéarité ? • Présentation du modèle linéaire • Introduction à Scitkitlearn

  • CONCEPT DE RÉGRESSION

Qu’est ce que la régression ? • Mesurer la performance d’un modèle • Régression et modèle linéaire • Concept d’overfitting

  • FEATURE ENGINEERING

Valeurs manquantes et valeurs catégorielles • Création de nouvelles features • Présentation de l’API Scikitlearn • Génération d’un nouveau Dataset

  • KNN

KNN et régression • Histoire du KMeans • Avantages et inconvénients

  • ARBRES DE DÉCISION

Qu’est-ce qu’un arbre de décision ? • Overtiffing et présentation des solutions

Objectifs pédagogiques
  • Comprendre les enjeux et interactions avec les autres métiers
  • Se familiariser avec l’environnement technique
  • Maîtriser le vocabulaire
  • Implémenter un modèle apprenant
Prérequis
  • Une forte appétence pour les mathématiques et des bases en développement informatique est demandée.
Cible
  • Développeurs : vous connaissez la programmation informatique et souhaitez vous orienter vers des problématiques de machine learning
  • Data Engineer : vous travaillez au quotidien avec des Data Scientists et souhaitez gagner en efficacité dans votre workflow
  • Métier : vous interagissez au quotidien avec des Data Scientists et souhaitez avancer dans la même direction
Durée
  • 2 jours de 7 heures, soit 14 heures
  • De 9h à 17h.
Lieu
  • Distanciel par Zoom

Formation réalisée par LinkValue