Formation Théorique & Pratique

Manipulation des données sous R avec les packages dplyr, tidyr, lubridate, forcats et stringr

S'inscrire
  • Session : 
    • le 27 septembre 2023 à Paris

// De 9h00 à 17h00

  • Durée : 1 journée – 7 heures
  • Pédagogie : Effectif : 10 Personnes

La formation repose sur une alternance de cours théoriques et de travaux pratiques

La formation sera sanctionnée par une attestation de formation

  • Moyens pédagogiques et techniques d’encadrement

Un vidéoprojecteur // Connexion WIFI haut débit // Un support de cours numérique // Un paperboard // Un ordinateur par participant

  • Accessibilité : 

Formation accessible au public à mobilité réduite – Adaptation des moyens de la prestation aux personnes en situation de handicap

  • Référence : BIF-06
  • Frais pédagogiques :

600 € HT – Académiques : 540 € HT

Déjeuner offert

  • Formateur :

Mme C. DELLA VEDOVA

  • Public concerné :

Toute personne amenée à travailler avec des données, à l’aide du logiciel R, et souhaitant les manipuler aisément et efficacement

  • Prérequis :

Connaissances de base sur le logiciel R : les types de données, les structures de données, la création et la manipulation d’objets, l’importation de données

 


PROGRAMME

Module 1 : Manipulation de données avec le package dplyr

> Introduction au package tidyverse et à la notion de pipe

> Sélection des colonnes (variable) avec la fonction select()

> Sélection de lignes avec la fonction filter()

> Création de nouvelles variables avec la fonction mutate()

> Création de tables résumées avec les fonctions group_by() et summarise()

Module 2 : Combinaison de deux tableaux de données

> Fonctions d’assemblage de lignes

> Notion de clé primaire

> Fonctions de fusion de tables

Module 3 : Transformation du format des tables avec le package tidyr

> Format wide et format long

> Passage d’un format wide à un format long

> Passage d’un format long à un format wide

Module 4 : Gestion des données de dates et d’heure avec le package lubridate

> Spécificité des données de date et d’heure et norme

> Les fonctions de parsing du package lubridate

> Les fonctions d’extraction du package lubridate

Module 5 : Gestion des données de type factor

> Présentation de l’addin questionr et du package forcats

> Renommer les modalités (levels)

> Réordonner les modalités

> Regrouper les modalités

Module 6 : Initiation à la gestion des chaînes de caractères avec le package stringr

> Présentation du package stringr

> Quelques fonctions de manipulation : découpage, remplacement, suppression etc..

OBJECTIFS/COMPETENCES

  • Apprendre à manipuler les tables de données dans R : création de sous jeux de données, de nouvelles variables,de tables résumées
  • Apprendre à assembler des tables de données, et à les pivoter
  • Apprendre à utiliser les données de date et d’heure avec le package lubridate
  • S’initier à la gestion des variables catégorielles et des chaînes de caractères avec les packages forcats et stringr

Télécharger le programme de la formation en .pdf

Télécharger

Indiquez votre adresse pour recevoir le fichier par email.

Télécharger le bulletin d'inscription

Télécharger

Indiquez votre adresse pour recevoir le fichier par email.

Imprimer cette fiche

Contactez nous !

Inscrivez-vous !

Dernière modification le 29 août 2022 à 11:06