Initiation à la datascience – formation prise en charge par votre CPF

13 septembre 2021

Jour complet

Toulon

Inscription

toulon

1320 euros TTC

Anne Marie Richier

0623803102

Courriel

Site web de l'événement

Fin de l'événement : 14 septembre 2021

La datascience, ou science de la donnée permet aux entreprises de connaitre des tendances grâce aux analyses des gros volumes de données. Les informations obtenues sont exploitées comme des aides à la décision. L’une des richesses des entreprises est leur data, qu’elle doivent exploiter. Les data scientist dont des experts de la donnée de plus en plus recherchés.

La formation vous donne les bases du métier.

Il n’y a pas de prérequis mais une forte appétence en mathématiques est demandée.

Partie 1

Objectifs : Comprendre les enjeux et interactions avec les autres métiers et se familiariser avec l’environnement technique

A QUOI SERT LA DATA SCIENCE

Définition et rôle du Data Scientist • Panel de projets Data Science • Principaux concepts data

MISE EN PLACE DE L’ENVIRONNEMENT TECHNIQUE

Python, Jupyter, Scikit-Learn et Pandas • Clonage du repo et récupération des notebooks • Définition de la problématique posée : prédire combien un client va dépenser sur un site e-commerce durant la 1ere année • Roadmap projet

ANALYSE SIMPLE DE DONNÉES

La donnée : format, nature et structure • Définition d’un ordre de grandeur • Notion d’échantillon et diversité • Présentation d’un 1er modèle abstrait et familiarisation avec les principaux concepts et le vocabulaire

MODÈLE ABSTRAIT ET FAMILIARISATION AVEC LE MACHINE LEARNING

Qu’est-ce qu’un modèle mathématique ? • Distinction entre apprentissage supervisé et apprentissage non supervisé

Partie 2

Objectifs : Maîtriser le vocabulaire et implémenter un modèle apprenant

MODÈLE LINÉAIRE À 2 VARIABLES POUR LA CLASSIFICATION

Solutions analytiques vs solutions stochastiques • Qu’est ce que la linéarité ? • Présentation du modèle linéaire • Introduction à Scitkitlearn

CONCEPT DE RÉGRESSION

Qu’est ce que la régression ? • Mesurer la performance d’un modèle • Régression et modèle linéaire • Concept d’overfitting

FEATURE ENGINEERING

Valeurs manquantes et valeurs catégorielles • Création de nouvelles features • Présentation de l’API Scikitlearn • Génération d’un nouveau Dataset

KNN

KNN et régression • Histoire du KMeans • Avantages et inconvénients

ARBRES DE DÉCISION

Qu’est-ce qu’un arbre de décision ? • Overtiffing et présentation des solutions

Objectifs pédagogiques

Comprendre les enjeux et interactions avec les autres métiers
Se familiariser avec l’environnement technique
Maîtriser le vocabulaire
Implémenter un modèle apprenant

Prérequis

Une forte appétence pour les mathématiques et des bases en développement informatique est demandée.

Cible

Développeurs : vous connaissez la programmation informatique et souhaitez vous orienter vers des problématiques de machine learning
Data Engineer : vous travaillez au quotidien avec des Data Scientists et souhaitez gagner en efficacité dans votre workflow
Métier : vous interagissez au quotidien avec des Data Scientists et souhaitez avancer dans la même direction

Durée

2 jours de 7 heures, soit 14 heures
De 9h à 17h.

Lieu

Distanciel par Zoom

Formation réalisée par LinkValue