Description
Data Science avec R
Durée : 28 heures
Modalités techniques d’évaluation : Évaluation des connaissances par QCM, évaluation des compétences au travers de travaux pratiques et de cas d’études. Contrôle de l’acquisition des connaissances et des compétences pendant la formation par le formateur.
Moyens pédagogiques : Apports théoriques réalisés en classe et complétés par de nombreux travaux pratiques permettent aux participants de disposer d’une expérience concrète. A l’issue des sessions magistrales, réalisation de cas d’études tutorés.
Objectifs :
- Maîtrise de l’environnement de travail de R avec Rstudio
- Manipulation et gestion de données avec R et les packages de data manipulation les plus récents (dplyr, data.table…)
- Maîtrise de l’application de méthodes de data science
- Connaitre les bases de la programmation avec R
Programme :
le langage R et son environnement :
- Définition de l’environnement
- Présentation de la notion de packages
- Présentation de RStudio
- Les possibilités de R pour la création de documents (scripts, Rmarkdown, Rnotebook…)
- Présentation des packages importants pour la manipulation de données
Les structures et les fonctionnalités de base de R :
- L’importation des données (.txt, .csv, .xls, .sav…)
- Les fonctionnalités de base pour la gestion des données
Utilisation avancée de la gestion des données avec R :
- La grammaire de dplyr
Statistiques descriptives avec R
- Les fonctionnalités pour la description statistique des données
- La gestion des graphiques (histogrammes, box-plot…)
Le data mining et le machine learning avec R
- L’analyse descriptive des données multivariées et la réduction de dimensions (ACP)
- Présentation et utilisation du package FactoMineR
- Apprentissage supervisé – cas pratiques avec R
- La régression logistique
- Les arbres de décisions
- Les forêts aléatoires et les GBM
- Présentation du package caret pour ajuster les hyper-paramètres
- L’apprentissage non supervisé – cas pratiques avec R (k-means…)
Quelques notions de programmation avec R
- Les standards de la programmation avec R
- Construire une fonction R pour automatiser des analyses
- Les structures de contrôle : if, for, while…