Les algorithmes s’imposent comme l’un des sujets prédominants du Big Data. Ce sont les outils des méthodes exploratoires, explicatives ou prédictives que l’on applique aux données, dans le cadre du Machine Learning. Ce cours vous permettra d’acquérir les compétences nécessaires à l’utilisation d’Azure Machine Learning.
Description
Durée : 28 heures
Modalités techniques d’évaluation : Évaluation des connaissances par QCM, évaluation des compétences au travers de travaux pratiques et de cas d’études. Contrôle de l’acquisition des connaissances et des compétences pendant la formation par le formateur.
Moyens pédagogiques : Apports théoriques réalisés en classe et complétés par de nombreux travaux pratiques permettent aux participants de disposer d’une expérience concrète. A l’issue des sessions magistrales, réalisation de cas d’études tutorés.
Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
- Prendre en main l’interface d’Azure Machine Learning
- Choisir parmi plusieurs algorithmes équivalents selon une problématique
- Découvrir les bases des langages R et Python pour augmenter les capacités d’Azure Machine Learning
- Exploiter une expérience au travers d’un Web Service
Exercice
Prise en main de l’interface Azure Machine Learning
- L’offre Azure. Facturation à l’usage.
- Prise en main de l’interface Machine Learning Studio.
- Créer un dataset. Se connecter à une source de données.
- Construire une expérience de ML.
- Définir un Web Service prédictif.
- La Gallery Cortana Intelligence.
Travaux pratiques
Prise en main de l’interface Azure ML. Création d’un dataset. Définition d’un Web Service prédictif.
Créer une expérience de Machine Learning
- Utiliser l’arbre de choix des algorithmes.
- Détecter les valeurs aberrantes.
- Choisir les variables de l’algorithme (features sélection).
- Initialiser le modèle, entraîner le modèle, évaluer le modèle.
- Reformer un modèle prédictif.
- Transformer les variables de l’algorithme (features engineering).
- Limiter les lignes d’un jeu de données.
Travaux pratiques
Évaluer des différents algorithmes à l’aide de la courbe ROC.
Savoir paramétrer les grandes familles d’algorithmes
- Algorithmes de clustering (approche non supervisée).
- Algorithmes de régression linéaire.
- Algorithmes de régression logistique ou ordinale.
- Algorithmes de classification (approche supervisée) binaire ou one-versus-all.
- Méthodes ensemblistes (forêt, jungle…).
- Packages R et Python. Le framework Vowpall Wabbit.
- Paramétrage des algorithmes.
Travaux pratiques
Paramétrer des familles d’algorithmes avec R/Python.
Traiter d’autres types de données
- Analyser les séries temporelles, détecter les anomalies.
- Analyse de données textuelles avec les packages R.
- Appliquer un algorithme Vowpal Wabbit (Latent Dirichlet Analysis).
- Exploiter les images avec notebooks Jupyter.
Travaux pratiques
Traitement des données texte ou image.
Découvrir les nouveaux outils autour d’Azure Machine Learning
- Nouvelles briques Azure pour le ML (Experimentation / Model Management).
- Inspection et préparation des données (transformations par exemple, transformations avancées).
- Mise en œuvre des instances Azure Machine Learning.
- Suivi des exécutions et des métriques d’évaluation.
- Scénarios de déploiement (local/Spark/Docker/AKS).
Travaux pratiques
Préparation de données et transformations avancées.