Manipulation des données sous R avec les packages dplyr, tidyr, lubridate, forcats et stringr

Réf : BIF-06

Télécharger le programme Télécharger le synopsis S'inscrire à la formation

Durée

1 journée - 7 heures
// De 9h00 à 17h00

Pédagogie

Effectif : 10 Personnes
La formation repose sur une alternance de cours théoriques et de travaux pratiques
La formation sera sanctionnée par une attestation de formation

Moyens pédagogiques et techniques d’encadrement

Un vidéoprojecteur // Connexion WIFI haut-débit // Un support de cours numérique // Un paperboard // Un ordinateur par participant

Accessibilité

Accessibilité dépendante du site de formation en vos murs

Frais pédagogique

Sur devis

Formateur

Mme C. Della Vedova

Public concerné

Toute personne amenée à travailler avec des données, à l'aide du logiciel R, et souhaitant les manipuler aisément et efficacement

Prérequis

Connaissances de base sur le logiciel R : les types de données, les structures de données, la création et la manipulation d’objets, l’importation de données

Objectifs / Compétences

de la formation manipulation des données sous R avec les packages dplyr, tidyr, lubridate, forcats et stringr

  • Apprendre à manipuler les tables de données dans R : création de sous jeux de données, de nouvelles variables,de tables résumées
  • Apprendre à assembler des tables de données, et à les pivoter
  • Apprendre à utiliser les données de date et d’heure avec le package lubridate
  • S’initier à la gestion des variables catégorielles et des chaînes de caractères avec les packages forcats et stringr
S'inscrire à la formation

Programme de la formation: Manipulation des données sous R avec les packages dplyr, tidyr, lubridate, forcats et stringr

Module 1 : Manipulation de données avec le package dplyr

Introduction au package tidyverse et à la notion de pipe

Sélection des colonnes (variable) avec la fonction select()

Sélection de lignes avec la fonction filter()

Création de nouvelles variables avec la fonction mutate()

Création de tables résumées avec les fonctions group_by() et summarise()

Module 2 : Combinaison de deux tableaux de données

Fonctions d’assemblage de lignes

Notion de clé primaire

Fonctions de fusion de tables

Module 3 : Transformation du format des tables avec le package tidyr

Format wide et format long

Passage d’un format wide à un format long

Passage d’un format long à un format wide

Module 4 : Gestion des données de dates et d’heure avec le package lubridate

Spécificité des données de date et d’heure et norme

Les fonctions de parsing du package lubridate

Les fonctions d’extraction du package lubridate

Module 5 : Gestion des données de type factor

Présentation de l’addin questionr et du package forcats

Renommer les modalités (levels)

Réordonner les modalités

Regrouper les modalités

Module 6 : Initiation à la gestion des chaînes de caractères avec le package stringr

Présentation du package stringr

Quelques fonctions de manipulation : découpage, remplacement, suppression etc..

Manipulation des données sous R avec les packages dplyr, tidyr, lubridate, forcats et stringr

Réf : BIF-06

Pour nous contacter par téléphone

S'inscrire à la formation

    Dernière modification le 5 septembre 2023 à 13h21