Initiation à la datascience – formation prise en charge par votre CPF
Initiation à la datascience – formation prise en charge par votre CPFtoulon
1320 euros TTC
Anne Marie Richier
0623803102
Fin de l'événement : 14 septembre 2021
La datascience, ou science de la donnée permet aux entreprises de connaitre des tendances grâce aux analyses des gros volumes de données. Les informations obtenues sont exploitées comme des aides à la décision. L’une des richesses des entreprises est leur data, qu’elle doivent exploiter. Les data scientist dont des experts de la donnée de plus en plus recherchés.
La formation vous donne les bases du métier.
Il n’y a pas de prérequis mais une forte appétence en mathématiques est demandée.
Partie 1
Objectifs : Comprendre les enjeux et interactions avec les autres métiers et se familiariser avec l’environnement technique
- A QUOI SERT LA DATA SCIENCE
Définition et rôle du Data Scientist • Panel de projets Data Science • Principaux concepts data
- MISE EN PLACE DE L’ENVIRONNEMENT TECHNIQUE
Python, Jupyter, Scikit-Learn et Pandas • Clonage du repo et récupération des notebooks • Définition de la problématique posée : prédire combien un client va dépenser sur un site e-commerce durant la 1ere année • Roadmap projet
- ANALYSE SIMPLE DE DONNÉES
La donnée : format, nature et structure • Définition d’un ordre de grandeur • Notion d’échantillon et diversité • Présentation d’un 1er modèle abstrait et familiarisation avec les principaux concepts et le vocabulaire
- MODÈLE ABSTRAIT ET FAMILIARISATION AVEC LE MACHINE LEARNING
Qu’est-ce qu’un modèle mathématique ? • Distinction entre apprentissage supervisé et apprentissage non supervisé
Partie 2
Objectifs : Maîtriser le vocabulaire et implémenter un modèle apprenant
- MODÈLE LINÉAIRE À 2 VARIABLES POUR LA CLASSIFICATION
Solutions analytiques vs solutions stochastiques • Qu’est ce que la linéarité ? • Présentation du modèle linéaire • Introduction à Scitkitlearn
- CONCEPT DE RÉGRESSION
Qu’est ce que la régression ? • Mesurer la performance d’un modèle • Régression et modèle linéaire • Concept d’overfitting
- FEATURE ENGINEERING
Valeurs manquantes et valeurs catégorielles • Création de nouvelles features • Présentation de l’API Scikitlearn • Génération d’un nouveau Dataset
- KNN
KNN et régression • Histoire du KMeans • Avantages et inconvénients
- ARBRES DE DÉCISION
Qu’est-ce qu’un arbre de décision ? • Overtiffing et présentation des solutions
Objectifs pédagogiques
- Comprendre les enjeux et interactions avec les autres métiers
- Se familiariser avec l’environnement technique
- Maîtriser le vocabulaire
- Implémenter un modèle apprenant
Prérequis
- Une forte appétence pour les mathématiques et des bases en développement informatique est demandée.
Cible
- Développeurs : vous connaissez la programmation informatique et souhaitez vous orienter vers des problématiques de machine learning
- Data Engineer : vous travaillez au quotidien avec des Data Scientists et souhaitez gagner en efficacité dans votre workflow
- Métier : vous interagissez au quotidien avec des Data Scientists et souhaitez avancer dans la même direction
Durée
- 2 jours de 7 heures, soit 14 heures
- De 9h à 17h.