Description
Durée : 28 heures
Modalités techniques d’évaluation : Évaluation des connaissances par QCM, évaluation des compétences au travers de travaux pratiques et de cas d’études. Contrôle de l’acquisition des connaissances et des compétences pendant la formation par le formateur.
Moyens pédagogiques : Apports théoriques réalisés en classe et complétés par de nombreux travaux pratiques permettent aux participants de disposer d’une expérience concrète. A l’issue des sessions magistrales, réalisation de cas d’études tutorés.
Objectifs :
LA FORMATION HADDOP CLOUDDERA VOUS PERMETTRA :
- Connaître Hadoop 2.0 et Hadoop Distributed File System
- Comprendre comment mettre en oeuvre le nouveau Framework YARN dans Hadoop 2.0
- Apprendre à programmer avec « MapReduce »
- Savoir optimiser une tache MapReduce en suivant les meilleures pratiques
- Être en mesure de créer des workflows avec Oozie
- Comprendre comment créer et éxécuter des requêtes Hive sur des données HDFS
- Créer des tâches MapReduce permettant d’analyser des données avec Pig
- Savoir débugger des programmes « MapReduce » pour les fiabiliser
Programme de la formation CLOUDERA
JOUR 1
- Les technologies Hadoop
- Comment fonctionne « Hadoop Distributed File System » et « MapReduce »
- Comment développer des applications “MapReduce”
JOUR2
- Comment réaliser des tests unitaires d’applications MapReduce
- Comment utiliser des combinateurs MapReduce, des partitionners et des caches distribués
- Les meilleures pratiques pour développer et débugger des applications MapReduce
JOUR 3
- Comment mettre en oeuvre l’entrée et la sortie des données dans les applications MapReduce
- Les algorithmes pour les principales tâches “MapReduce”
- Comment relier des ensembles de données dans MapReduce
- Comment Hadoop s’intègre dans le Data Center
- Comment utiliser les algorithmes d’apprentissage automatique de Mahout
- Comment Hive et Pig peuvent être utilisés pour développer rapidement des applications
- Comment créer des workflows importants avec Oozie