Pré-requis : Notions d'algorithmique
Objectifs : Découvrir le langage R et son écosystème pour la data science. Apprendre à écrire du code structuré, lisible et maintenable en R. Importer, nettoyer et préparer des données issues de multiples sources. Maîtriser la manipulation de données avec le tidyverse et les pipelines. Créer des visualisations statiques et interactives impactantes. Produire des documents reproductibles pour le reporting. Réaliser des analyses statistiques descriptives et inférentielles. S’initier à la modélisation statistique et au machine learning avec R.
Sanction : Attestation de fin de formation mentionnant le résultat des acquis
Référence : PRO102049-F
Accessibilité : Si vous êtes en situation de handicap, nous sommes en mesure de vous accueillir, n'hésitez pas à nous contacter à referenthandicap@dawan.fr, nous étudierons ensemble vos besoins
Contact : commercial@dawan.fr
3 475,00 CHF HT
Statistique, data science, visualisation
Exemples de secteurs
Écosystème R
CRAN
Packages : définition, installation, gestion
Atelier : installation et chargement de packages
RStudio et organisation de projet
Création de projets
Organisation des répertoires, chemins relatifs
Atelier : créer un projet RStudio
Vecteurs
Listes
Data frames
Matrices
Facteurs
Atelier : création et manipulation de chaque type
Normes de codage
Nommage, commentaires
Organisation des scripts
Structures de contrôle
Conditionnelles : if, else
Boucles : for, while, repeat
apply, lapply, map
Atelier : écrire des structures conditionnelles et des boucles
Syntaxe de base
Arguments, valeurs de retour
Fonctions anonymes
Bonnes pratiques
Atelier : automatiser des analyses avec ses propres fonctions
Formats : .csv, .txt, .xls(x), .sav, JSON
Packages : readr, readxl, haven, jsonlite
Connexions bases de données : DBI, dbplyr
Encodage, séparateur, gestion des NA
Atelier pratique : importer différents formats
Notion de pipeline
Manipulation avec dplyr et tidyr
Filtrer, sélectionner, trier
Créer des variables
Fusionner, joindre
Reshaping : pivot_longer, pivot_wider
Gestion des valeurs manquantes
Atelier : pipeline complet avec dplyr et tidyr
Importance exploratoire
Types de graphiques adaptés
Syntaxe de base
Histogrammes, boxplots, scatterplots, bar charts
Facets et thèmes
Atelier pratique: graphiques statiques
plotly pour ggplot
Cartes interactives avec leaflet (optionnel)
Atelier pratique : transformer un ggplot en interactif
RMarkdown, Quarto, Notebooks
Avantages et usages
Atelier : création d’un document reproductible
Gestion de versions avec Git
Intégration RStudio
Initialisation, commits
Atelier pratique : prise en main de Git avec RStudio
Moyenne, médiane, écart-type
Résumés, quantiles, tableaux de fréquence
Atelier pratique: résumer un dataset
t-tests, ANOVA, chi-deux
Corrélations : Pearson, Spearman
Packages : base R, broom
Atelier pratique : réaliser et interpréter des tests
Régressions linéaire et logistique
Analyse des résidus
Visualisation des résultats
Atelier : ajuster et interpréter des modèles
Atelier pratique : réaliser une ACP
K-means clustering
Préparation des données, choix du k
Visualisation des clusters
Atelier pratique : segmentation (identifier des sous-populations aux caractéristiques similaires)
Composantes d’une série
Modèles ARIMA, SARIMA (forecast)
Visualisation des prévisions
Délai d'accès :Le délai d’accès à la formation certifiante est de 7 jours après validation du dossier. Dans le cas d’un financement via votre CPF, la validation de votre dossier devra être réalisée 11 jours ouvrés avant le début de formation
Modalités d’évaluation : Les évaluations en cours de formations sont réalisées par les ateliers de mise en pratique et les échanges avec les formateurs
Fondamentaux du développement en langage R
Pour suivre une session à distance depuis l'un de nos centres, contactez-nous.
Lieu | Date | Remisé | Actions |
---|---|---|---|
Distance | Du 01/09/2025 au 05/09/2025 | S'inscrire | |
Distance | Du 15/09/2025 au 19/09/2025 | S'inscrire | |
Distance | Du 27/10/2025 au 31/10/2025 | S'inscrire |