Description

Durée : 28 heures
Modalités techniques d’évaluation : Évaluation des connaissances par QCM, évaluation des compétences au travers de travaux pratiques et de cas d’études. Contrôle de l’acquisition des connaissances et des compétences pendant la formation par le formateur.
Moyens pédagogiques : Apports théoriques réalisés en classe et complétés par de nombreux travaux pratiques permettent aux participants de disposer d’une expérience concrète. A l’issue des sessions magistrales, réalisation de cas d’études tutorés.

Objectifs

  •  Cette formation permet de découvrir le concept du Big Data et ses principaux enjeux.
  • Elle permet aussi d’apprendre les compétences clés et les métiers du Big Data.
  • A l’issue de cette formation, vous serez capable de concevoir des modèles d’analyse à l’aide de la découverte des technologies mobilisées dans le cadre du Big Data.

Programme détaillé

Concepts et principaux enjeux du Big Data

  • Introduction aux 3V (volume, variété, vélocité) et aux 7 V
  • Les facteurs d’émergence du Big Data
  • Enjeux, défis et problèmes pour l’entreprise
  • Exemples d’application du Big Data

Compétences clés et métiers du Big Data

  • Profil d’un data scientist
  • Découvertes des métiers du Big Data (Chief Data Officer, Data Architect…)
  • Expérimentation dans un datalab
  • Mobiliser les compétences en interne et en externe

Environnement technologique du Big Data

  • Comprendre le framework Hadoop et le pattern MapReduce
  • Open Source participant au développement de Hadoop
  • Ecosystème autour d’Hadoop (HDFS, NOSQL, Spark, Pig, Hive, Mahout…)
  • Comparer les distributions Hadoop

Modèles d’analyse pour le Big Data

  • Optimiser l’analyse des données
  • Evaluer un score par modèle de régression (score d’attrition, de risque, d’appétence…)
  • Segmenter une population par clustering
  • Analyser l’opinion à partir de verbatims

Différentes phases d’un projet Big Data

  • Étude d’opportunité et de faisabilité, évaluation du retour sur investissement (ROI)
  • Extraction des données
  • Construction de modèles
  • Analyse des données
  • Mises en place d’actions prescriptives ou préventives