Le Machine Learning couvre l’ensemble des méthodes et concepts qui permettent d’extraire automatiquement à partir de données, des modèles de prédiction et de prise de décision. Durant ce cours, vous mettrez en œuvre les différents algorithmes du domaine et appréhendez les bonnes pratiques d’un projet Machine Learning.

Description

Durée : 28 heures
Modalités techniques d’évaluation : Évaluation des connaissances par QCM, évaluation des compétences au travers de travaux pratiques et de cas d’études. Contrôle de l’acquisition des connaissances et des compétences pendant la formation par le formateur.
Moyens pédagogiques : Apports théoriques réalisés en classe et complétés par de nombreux travaux pratiques permettent aux participants de disposer d’une expérience concrète. A l’issue des sessions magistrales, réalisation de cas d’études tutorés.

Objectifs pédagogiques

À l’issue de la formation, le participant sera en mesure de :

  • Comprendre les différents modèles d’apprentissage
  • Modéliser un problème pratique sous forme abstraite
  • Identifier les méthodes d’apprentissage pertinentes pour résoudre un problème
  • Appliquer et évaluer les méthodes identifiées sur un problème
  • Faire le lien entre les différentes techniques d’apprentissage
PROGRAMME DE FORMATION

Introduction au Machine Learning

  • Le Big Data et le Machine Learning.
  • Les algorithmes d’apprentissage supervisés, non supervisés et par renforcement.
  • Les étapes de construction d’un modèle prédictif.
  • Détecter les valeurs aberrantes et traiter les données manquantes.
  • Comment choisir l’algorithme et les variables de l’algorithme ?

Démonstration
Prise en main de l’environnement Spark avec Python à l’aide de Jupyter Notebook. Visualiser plusieurs exemples de modèles fournis.

Procédures d’évaluation de modèles

  • Les techniques de ré-échantillonnage en jeu d’apprentissage, de validation et de test.
  • Test de représentativité des données d’apprentissage.
  • Mesures de performance des modèles prédictifs.
  • Matrice de confusion, de coût et la courbe ROC et AUC.

Travaux pratiques
Evaluation et comparaison des différents algorithmes sur les modèles fournis.

Les modèles prédictifs, l’approche fréquentiste

  • Apprentissage statistique.
  • Conditionnement des données et réduction de dimension.
  • Machines à vecteurs supports et méthodes à noyaux.
  • Quantification vectorielle.
  • Réseaux de neurones et Deep Learning.
  • Ensemble learning et arbres de décision.
  • Les algorithmes de Bandits, optimisme face à l’incertitude.

Travaux pratiques
Mise en œuvre des familles d’algorithmes en utilisant des jeux de données variés.

Les modèles et apprentissages bayésiens

  • Principes d’inférence et d’apprentissage bayésiens.
  • Modèles graphiques : réseaux bayésiens, champs de Markov, inférence et apprentissage.
  • Méthodes bayésiennes : Naive Bayes, mélanges de gaussiennes, processus gaussiens.
  • Modèles markoviens : processus markoviens, chaînes de Markov, chaînes de Markov cachées, filtrage bayésien.

Travaux pratiques
Mise en œuvre des familles d’algorithmes en utilisant des jeux de données variés.

Machine Learning en production

  • Les spécificités liées au développement d’un modèle en environnement distribué.
  • Le déploiement Big Data avec Spark et la MLlib.
  • Le Cloud : Amazon, Microsoft Azure ML, IBM Bluemix…
  • La maintenance du modèle.

Travaux pratiques
Mise en production d’un modèle prédictif avec l’intégration dans des processus de batch et dans des flux de traitements.