Description

Durée : 28 heures
Modalités techniques d’évaluation : Évaluation des connaissances par QCM, évaluation des compétences au travers de travaux pratiques et de cas d’études. Contrôle de l’acquisition des connaissances et des compétences pendant la formation par le formateur.
Moyens pédagogiques : Apports théoriques réalisés en classe et complétés par de nombreux travaux pratiques permettent aux participants de disposer d’une expérience concrète. A l’issue des sessions magistrales, réalisation de cas d’études tutorés.

Objectifs

  • Comprendre le fonctionnement de Mahout et ses différentes fonctionnalités 
  • Savoir implémenter des algorithmes de Machine Learning en local ou en environnement distribué 
  • Maitriser son installation sur une ferme SPARK 

Programme Apache Mahout – Analyse des données

INTRODUCTION

  • Présentation Apache Mahout
  • Apache Mahout, son écosystème
  • Les fonctionnalités d’Apache Mahout
  • Les différents arbres : Décision, régression, régression automatique
  • Scoring

L’ARCHITECTURE

  • Fonctionnement d’Apache Mahout
  • A savoir sur les données : Sources, formats etc…
  • Travaux pratiques sur les recommandations, traitement et filtrage

MISE EN OEUVRE

  • Installation de façon autonome
  • Exemples
  • Les algorithmes les plus utilisés
  • Utilisation avec Hadoop Yarn | SPARK etc..
  • Installation sur une ferme SPARK