IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

R : dplyr : Comprendre les étapes de %>%


Sujet :

R

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2008
    Messages
    16
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2008
    Messages : 16
    Points : 16
    Points
    16
    Par défaut R : dplyr : Comprendre les étapes de %>%
    Bonjour,

    J'ai récupéré, je ne sais plus où, ce programme :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    library(gapminder)
    new_gap <- gapminder
    new_gap %>% head()
    new_gap %>%
      select(country, year, continent, lifeExp) %>%
      group_by(continent, country) %>%
      ## within country, take (lifeExp in year i) - (lifeExp in year i - 1)
      ## positive means lifeExp went up, negative means it went down
      mutate(le_delta = lifeExp - lag(lifeExp)) %>% 
      ## within country, retain the worst lifeExp change = smallest or most negative
      summarize(worst_le_delta = min(le_delta, na.rm = TRUE)) %>% 
      ## within continent, retain the row with the lowest worst_le_delta
      top_n(-1, wt = worst_le_delta) %>%  ## top_n() : voir plus loin
      arrange(worst_le_delta)
    et pour mieux le comprendre, j'ai voulu le décortiquer par étape... et je n'y arrive pas (j'ai déjà fait plusieurs essais).
    Pouvez-vous m'aider ? Merci

    Par étape :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    library(gapminder)
    head(gapminder)  
    names(gapminder)  
    glimpse(gapminder)  
    select(gapminder, country, year, continent, lifeExp)  
    group_by(gapminder, continent, country)  
    gapminder_ <-mutate(gapminder, le_delta = lifeExp - lag(lifeExp)) 
    gapminder__<-summarize(gapminder_, worst_le_delta = min(le_delta, na.rm = TRUE))  
    gapminder__  
    str(gapminder__)  
    top_n(gapminder__, -1, wt = worst_le_delta)  
    arrange(worst_le_delta)
    Merci.

  2. #2
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    Au niveau du contexte d'application, ne sachant pas d'où sort ce code, difficile de vous aider...
    Par contre, au niveau de la programmation, voici quelques infos pour vous éclairer :

    > Le symbole %>% équivaut à un "pipe", ie. ce symbole permet d’enchaîner des opérations/modifications sur un jeu de données.
    Exemple :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    new_gap %>% head()
    # est équivalent à :
    head(new_gap)
    > Pour obtenir l'aide détaillée d'une fonction en R : ?glimpse.

    Pour le reste, je vous conseille de suivre un tutoriel sur les bases du package "dplyr" afin de vous familiariser avec ses fonctions, puis de reprendre ce code ensuite. Un lien qui vous servira très certainement : Data Wrangling With R Cheat Sheet.

    Bonne continuation


    Cordialement,


    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  3. #3
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2008
    Messages
    16
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2008
    Messages : 16
    Points : 16
    Points
    16
    Par défaut
    Bonjour A.D.,

    Merci pour votre réponse.
    En fait, gapminder est une base déjà incluse dans R et que l'on appelle grâce à library(). c'est un extrait de 1704 lignes et de 6 colonnes.
    Les variables sont : "country" (pays) "continent" "year" (année) "lifeExp"(espérance de vie) "pop" (population) "gdpPercap"(PNB)

    glimpse()équivaut à str(). J'aurai peut-être du rajouter qu'il faut aussi library(dplyr) pour utiliser les pipes

    Objet de mon poste : j'aurai bien voulu, au lieu d'avoir comme une longue phrase (à l'aide des %>% "pipe") avoir une césure à chaque étape pour bien comprendre.

    Merci de votre aide.

  4. #4
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    Ok, je comprends mieux votre question du coup.

    En fait, chaque étape peut être séparée au niveau du "pipe" %>% .

    Exemple :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    library(dplyr)
     
    new_gap %>%
      select(country, year, continent, lifeExp) %>%
      group_by(continent, country) %>%
      mutate(le_delta = lifeExp - lag(lifeExp))
     
    # peut être remplacé par exemple par :
     
    verif1 <- new_gap %>% select(country, year, continent, lifeExp)
    verif2 <- verif1 %>% group_by(continent, country)
    verif3 <- verif2 %>% mutate(le_delta = lifeExp - lag(lifeExp))
     
    # ce qui permet à chaque étape de voir le contenu de verifs*
    HTH !


    Cordialement,


    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Comprendre les étapes de l'algorithme SIFT
    Par looclooc dans le forum Traitement d'images
    Réponses: 6
    Dernier message: 08/12/2011, 15h54
  2. [MySQL] besoin d'aide pour comprendre les injections sql
    Par cassy dans le forum PHP & Base de données
    Réponses: 8
    Dernier message: 28/01/2007, 14h21
  3. Enumérer les TAPEs
    Par Amri_Daly dans le forum Windows
    Réponses: 1
    Dernier message: 31/10/2005, 17h09
  4. Comprendre les matrices 3D
    Par tavman dans le forum Algorithmes et structures de données
    Réponses: 5
    Dernier message: 11/09/2005, 13h18

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo