Discussion: Dictionnaire sous R

  1. #1
    Membre habitué
    Inscrit en
    novembre 2003
    Messages
    407
    Détails du profil
    Informations forums :
    Inscription : novembre 2003
    Messages : 407
    Points : 189
    Points
    189

    Par défaut Dictionnaire sous R

    Bonjour,
    Je cherche à créer un dictionnaire pour rendre plus rapide certaines affectations sous R, un peu comme sur d'autres langages (Python).
    Voici un exemple :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    DF=data.frame(X=c(1,4,6,3,1,1,5,2))
    Dico=list(X=c(1,2,3,4,5),Y=c('A','Y','C','K','U'))
    DF$Y <- Dico[Dico[['X']]==DF$X,'Y']
    Ici, le data.frame DF contient une seule colonne : X.
    Et j'essaie de créer la colonne Y en récupérant la valeur dans le dictionnaire Dico.
    La variable X contient aussi une valeur (6) non présente dans le dictionnaire. Mon objectif est que le code retourne NA s'il ne trouve pas la valeur idoine.

    Mais l'exécution de ce code génère une erreur non liée à cette valeur inconnue du dictionnaire, et qui provient du fait que la dimension de mon dictionnaire n'est pas égale à celle de ma table.

    Quelqu'un connaitrait-il la méthode adéquate (sans passer par l'instruction ifelse(), qui n'est pas très élégante, et surtout lente sur de grands tableaux de données) ?

  2. #2
    Membre éclairé
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    janvier 2012
    Messages
    318
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : janvier 2012
    Messages : 318
    Points : 870
    Points
    870

    Par défaut

    Je ne comprends pas trop ce que tu essayes de faire avec ta liste Dico. Pourquoi ne pas utiliser directement un vecteur ?:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    DF=data.frame(X=c(1,4,6,3,1,1,5,2))
    Y=c('A','Y','C','K','U')
    DF$Y=Y[DF$X]

  3. #3
    Membre habitué
    Inscrit en
    novembre 2003
    Messages
    407
    Détails du profil
    Informations forums :
    Inscription : novembre 2003
    Messages : 407
    Points : 189
    Points
    189

    Par défaut

    Bonjour,
    Une réponse tardive à ta question.

    En fait, il faut considérer X comme un identifiant quelconque, et non comme un entier, et je veux affecter la variable Y selon cet identifiant.
    C'est un cas plus général et c'est pourquoi je parlais de dictionnaire.

  4. #4
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    juin 2010
    Messages
    862
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 30
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : juin 2010
    Messages : 862
    Points : 2 585
    Points
    2 585

    Par défaut

    Bonjour,

    Voici une proposition à l'aide du package "dplyr" :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    require(dplyr)
     
    DF=data.frame(X=c(1,4,6,3,1,1,5,2))
    Dico=data.frame(X=c(1,2,3,4,5),Y=c('A','Y','C','K','U')) # il faut que Dico soit au format "data.frame" et non "list"
     
    Z <- full_join(DF, Dico, "X")
    Z
     
        X    Y
    1  1    A
    2  4    K
    3  6 <NA>
    4  3    C
    5  1    A
    6  1    A
    7  5    U
    8  2    Y
    Bonne continuation !


    Cordialement,


    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  5. #5
    Membre averti
    Inscrit en
    février 2011
    Messages
    160
    Détails du profil
    Informations forums :
    Inscription : février 2011
    Messages : 160
    Points : 332
    Points
    332

    Par défaut

    Bonjour,

    la fonction match est très utile et assez puissante dans ce genre de cas, et il existe une fonction encore plus performante fmatch (librairie fastmatch) :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    DF$Y <- Dico$Y[match(DF$X, Dico$X, nomatch = NA)]
    cdlt

  6. #6
    Membre habitué
    Inscrit en
    novembre 2003
    Messages
    407
    Détails du profil
    Informations forums :
    Inscription : novembre 2003
    Messages : 407
    Points : 189
    Points
    189

    Par défaut

    Merci à vous !
    C'est exactement ce que je recherchais.

    La solution avec match(...) me séduit en particulier, parce qu'elle ne fait pas appel à un paquetage supplémentaire.
    Sur un gros volume de données, ça accélère considérablement par rapport au ifelse(...) que j'utilisais auparavant.


+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. dictionnaire sous TeXworks mac OS
    Par nico_diou dans le forum Editeurs / Outils
    Réponses: 1
    Dernier message: 13/05/2011, 07h35
  2. Dictionnaire sous java
    Par havok77 dans le forum Langage
    Réponses: 1
    Dernier message: 12/01/2009, 14h44
  3. Dictionnaire sous linux
    Par logicave dans le forum Applications et environnements graphiques
    Réponses: 2
    Dernier message: 08/12/2006, 20h42
  4. [POO] objet "dictionnaire" sous Firefox
    Par spikelille dans le forum Général JavaScript
    Réponses: 3
    Dernier message: 12/07/2006, 17h04
  5. Besoin d'un dictionnaire sous linux
    Par mechatikhaled dans le forum Applications et environnements graphiques
    Réponses: 4
    Dernier message: 03/11/2005, 18h47

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo