IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Comparaison de cadres de données


Sujet :

R

  1. #1
    Nouveau membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2014
    Messages
    41
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2014
    Messages : 41
    Points : 31
    Points
    31
    Par défaut Comparaison de cadres de données
    Bonjour,
    Je souhaite comparer 2 dataframes dans le but de retourner le numéro des lignes d'un des dataframes qui correspondent avec celles du second dataframe. J'ai tenté d'utiliser la fonction which () dans une boucle for() comme ceci (CT6 = DATAFRAME 1; T6 = DATAFRAME 2) :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    > for(i in CT6){
    >w <- which(T6 == i)
    >print(w)
    >}
    Et voila ce que ça me dit:
    Error in T6 == i : comparison of these types is not implemented
    In addition: Warning messages:
    1: In which(T6 == i) :
    Incompatible methods ("Ops.data.frame", "Ops.factor") for "=="
    2: In T6 == i :
    longer object length is not a multiple of shorter object length
    La boucle for fonctionne très bien quand il s'agit de comparer l'une des variables communes, placées en colonnes, des 2 cadres mais pas avec l'ensemble des variables. Je vous joins mes cadres pour plus de clarté. Quelqu'un a-t-il une suggestion? Cordialement.

    http://cjoint.com/?ECrlxYiFmRh
    http://cjoint.com/?ECrlABXhU6D

  2. #2
    Membre éclairé
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    Janvier 2012
    Messages
    325
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Janvier 2012
    Messages : 325
    Points : 888
    Points
    888
    Par défaut
    Si j'ai bien compris ce que tu veux faire, tu devrais plutôt utiliser la fonction merge plutôt que faire une boucle.
    Ou éventuellement la fonction match.

  3. #3
    Nouveau membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2014
    Messages
    41
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2014
    Messages : 41
    Points : 31
    Points
    31
    Par défaut
    la fonction merge me renvoie un cadre fusionné des 2 cadres et la fonction match ne sert qu'à me confirmer s'il y a ou non des correspondances dans les cadres. Moi, je voudrais simplement comparer les 2 cadres pour retourner le numéro de ligne de T6 qui contient les mêmes valeurs de variables "ASSET", "DATE" et "HOUR" que CT6. Est-ce qu'il existe un moyen de faire ça avec R ?

  4. #4
    Membre éclairé
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    Janvier 2012
    Messages
    325
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Janvier 2012
    Messages : 325
    Points : 888
    Points
    888
    Par défaut
    C'est bien la fonction merge dont tu as besoin, si tu veux vraiment récupérer les n° de ligne de ta 2ème dataframe (même si je n'en vois pas trop l'intérêt), tu peux toujours ajouter une colonne "numéro de ligne" à cette dataframe, colonne que tu retrouveras dans la matrice "fusionnée".

  5. #5
    Membre averti
    Homme Profil pro
    Data Scientist
    Inscrit en
    Août 2013
    Messages
    139
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data Scientist
    Secteur : Industrie

    Informations forums :
    Inscription : Août 2013
    Messages : 139
    Points : 316
    Points
    316
    Par défaut
    Bonjour,

    Je te conseille de regarder le package compare qui permet de comparer différents objets sous R et notamment les data.frame ligne à ligne.

    Sinon, plus simplement si tu as deux data.frame (df1 et df2) et que tu veux savoir si il y a des lignes égales dans les deux data.frame tu peux "tricher" en faisant ceci :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    df <- rbind(df1,df2) # concaténation en ligne des deux data.frame
    duplicated(df) # renvoie les T ou F si la ligne est dupliqué ou non
    Bon courage

Discussions similaires

  1. Outils de comparaison de bases de données
    Par locus dans le forum Outils
    Réponses: 2
    Dernier message: 19/09/2007, 14h15
  2. comparaison acvec textbox et donnée
    Par christi dans le forum ASP.NET
    Réponses: 5
    Dernier message: 21/02/2007, 17h33
  3. [Conception] comparaison saisie/base de donnée
    Par arfelas dans le forum PHP & Base de données
    Réponses: 2
    Dernier message: 03/10/2006, 16h17
  4. comparaison de bases de données
    Par milielf dans le forum Access
    Réponses: 4
    Dernier message: 12/06/2006, 14h35
  5. Comparaison XML-base de donnée SQL
    Par mtaveau dans le forum XQUERY/SGBD
    Réponses: 11
    Dernier message: 02/05/2006, 03h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo