Durée

3 journées - 21 heures
// De 9h00 à 17h00
Du 10 au 12 décembre 2025

Pédagogie

Effectif : 5 personnes
Formation en distanciel
La formation repose sur une alternance de cours théoriques et de travaux pratiques
La formation sera sanctionnée par une attestation de formation

Moyens pédagogiques et techniques d’encadrement

Un vidéoprojecteur // Connexion WIFI haut-débit // Un support de cours numérique // Un paperboard // Un ordinateur par participant

Accessibilité

Formation accessible au public à mobilité réduite - Adaptation des moyens de prestation aux personnes en situation de handicap

Frais pédagogique

1490 € HT / Académiques : 1190 € HT

Formateur

C. DELLA VEDOVA

Public concerné

Toute personne amenée dans le cadre de son activité
professionnelle, ou ses études, quel que soit son domaine
d’application, à analyser des données avec le logiciel R, et souhaitant optimiser son processus de travail pour le rendre plus efficace, plus aisé et plus rapide

Prérequis

Connaissances de base de l’outil informatique

Durée

3 journées - 21 heures
// De 9h00 à 17h00

Pédagogie

Effectif : 7 personnes
La formation repose sur une alternance de cours théoriques et de travaux pratiques
La formation sera sanctionnée par une attestation de formation

Moyens pédagogiques et techniques d’encadrement

Un vidéoprojecteur // Connexion WIFI haut-débit // Un support de cours numérique // Un paperboard // Un ordinateur par participant

Accessibilité

Formation accessible au public à mobilité réduite - Adaptation des moyens de prestation aux personnes en situation de handicap

Frais pédagogique

Sur devis

Formateur

C. DELLA VEDOVA

Public concerné

Toute personne amenée dans le cadre de son activité
professionnelle, ou ses études, quel que soit son domaine
d’application, à analyser des données avec le logiciel R, et souhaitant optimiser son processus de travail pour le rendre plus efficace, plus aisé et plus rapide

Prérequis

Connaissances de base de l’outil informatique

Objectifs/Compétences

Optimiser son flux de travail sous R et travailler de manière plus efficace et reproductible

Structurer efficacement vos projets sous R en organisant votre code et en versionnant vos scripts avec Git

Importer, nettoyer et préparer vos données en automatisant les importations, en uniformisant les variables et en gérant les doublons

Manipuler des tableaux de données avec le package tidyverse, notamment en filtrant, transformant et résumant vos données, en effectuant des jointures et en changeant de format (wide/long)

Gérer les variables catégorielles (facteurs) avec forcats, en renommant et réorganisant les niveaux

Manipuler efficacement les chaînes de caractères avec stringr et glue, y compris en utilisant des expressions régulières

Travailler avec les dates et les heures grâce au package lubridate, en convertissant et en manipulant ces données

Initier un reporting automatisé avec Quarto, en structurant un document dynamique intégrant texte, code et graphiques

Créer des visualisations avancées avec ggplot2, en personnalisant les couleurs, formes, tailles et en affichant différents types de graphiques

S'inscrire à la formation

Programme de la formation: R pour la data analyse

Module 1 : Organisation de son travail sous R

Création de projet R

Architecture du projet R

Versionnage des scripts en local avec git

Module 2 : Importations

Gestion des problèmes d’encodage

Accélération des importations

Automatisation des importations de csv et xlsx

Module 3 : Manipulations avancées des data frame

Introduction au package tidyverse

Création de subsets, ajout de variables, transformation de variables

Création de tables agrégées par groupe

Autres manipulations utiles

Module 4 : Manipulations supplémentaires

Jointure de tables à l’aide d’une clé primaire

Assemblage de tables de même structure

Passage en format long et wide

Module 5 : Gestion des variables de type factor avec forcats

Afficher et renommer les niveaux

Modifier l’ordre des niveaux manuellement et automatiquement

Réaliser des regroupements de niveaux automatiquement

Module 6: Gestion des variables de types chaînes de caractères

Découpage, recherche, suppression, remplacement de pattern avec le package stringr

Création de chaîne de caractères complexes avec le package glue

Initiation aux expressions régulières

Module 7: Gestion des données de dates et d’heures avec le package lubridate

Conversion d’une chaîne de caractères en date

Extraction de différents éléments d’une date

Diverses manipulations : calcul de délais, arrondi, etc…

Module 8: Initiation au package purrr

Principe

Quelques exemples d’utilisation des fonctions map

Module 9: Nettoyage de données

Uniformisation des noms des variables

Création de labels

Gestion des doublons

Nettoyage et corrections divers

Module 10 : Initiation au reporting avec Quarto

Principe

Premiers éléments : titre, texte, code, graphiques, tables

Améliorations : numérotation, table des matières, légende et renvois

Module 11: Réalisation de graphiques avec ggplot2

Principe du package

Premiers graphiques de type scatterplot

Gestion des couleurs, forme, taille, courbe de tendance

Division en plusieurs sous fenêtre

Autres types de graphiques

R pour la data analyse

Réf : BIF-14

Pour nous contacter par téléphone

S'inscrire à la formation

    Dernière modification le 3 octobre 2025 à 12h04