IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Concaténation de 2 data.frame


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2015
    Messages
    16
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Val d'Oise (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2015
    Messages : 16
    Par défaut Concaténation de 2 data.frame
    Bonjour,

    J'ai 2 bases de données à ma disposition. 45.000 observations dans l'une, 15.000 dans l'autre et j'aimerais concaténer le tout en une seule de 60.000 observations.

    Les variables ne sont pas toutes identiques. La majeure partie oui, mais certaine sont dans l'une et pas dans l'autre & inversement.
    J'ai harmonisé les noms de variables en colonnes pour que celles présentes dans les deux soient identiques.

    Concrètement, je cherche à passer de ça :
    var1 var2 var3 var4 var5
    1 a1 b1 c1 d1 e1
    2 a2 b2 c2 d2 e2
    3 a3 b3 c3 d3 e3
    4 a4 b4 c4 d4 e4
    5 a5 b5 c5 d5 e5
    var6 var7 var3 var4 var5
    6 f6 g6 c6 d6 e6
    7 f7 g7 c7 d7 e7
    8 f8 g8 c8 d8 e8
    9 f9 g9 c9 d9 e9
    10 f10 g10 c10 d10 e10

    à ça :

    var1 var2 var3 var4 var5 var6 var7
    1 a1 b1 c1 d1 e1 NA NA
    2 a2 b2 c2 d2 e2 NA NA
    3 a3 b3 c3 d3 e3 NA NA
    4 a4 b4 c4 d4 e4 NA NA
    5 a5 b5 c5 d5 e5 NA NA
    6 NA NA c6 d6 e6 f6 g6
    7 NA NA c7 d7 e7 f7 g7
    8 NA NA c8 d8 e8 f8 g8
    9 NA NA c9 d9 e9 f9 g9
    10 NA NA c10 d10 e10 f10 g10

  2. #2
    Membre expérimenté Avatar de abysse
    Profil pro
    Inscrit en
    Mai 2008
    Messages
    222
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2008
    Messages : 222
    Par défaut
    Bonjour,
    tu peux utiliser la commande merge, lit la doc plus en savoir plus sur les options

    @+

  3. #3
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2015
    Messages
    16
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Val d'Oise (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2015
    Messages : 16
    Par défaut
    Ah effectivement.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    dfc <- merge(dfa, dfb, all = T)
    Je ne pensais pas que c'était aussi simple que ça. Désolé pour le dérangement. Merci.

  4. #4
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2015
    Messages
    16
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Val d'Oise (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2015
    Messages : 16
    Par défaut
    Un autre souci ...

    Comment puis - je attribuer la valeur 0 à mes valeurs manquantes (NA).
    Je souhaiterais appliquer ce code dans mes dfa & dfb pour ne pas les confondre avec les NA obtenues lors de la concaténation.

    Code J'ai essayé ce code : : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    for (i in 1:length(dfc)) {
      dfc[,i] <- ifelse(is.na(dfc[,i]) == T, 0, ?)
    }

    Mais je ne sais pas quoi mettre dans la seconde condition.

  5. #5
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 37
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Par défaut
    Bonjour,

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    for (i in 1:length(dfc)) {
      dfc[,i] <- ifelse(is.na(dfc[,i]) == T, 0, dfc[,i])
    }
    Dans le cas NA, on aura donc 0 et dans les autres cas on conservera la valeur existante.

    Bonne continuation


    Cordialement,


    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  6. #6
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2015
    Messages
    16
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Val d'Oise (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2015
    Messages : 16
    Par défaut
    C'est ce que j'avais essayé de faire. Mais ça ne fonctionne pas comme je l'imaginais.

    Je passe ainsi de :
    Nom : dfc1.JPG
Affichages : 933
Taille : 20,3 Ko

    à ça :
    Nom : dfc2.JPG
Affichages : 945
Taille : 17,2 Ko

    Après application de ce code :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    for (i in 1:length(dfc)) {
      dfc[,i] <- ifelse(is.na(dfc[,i]) == T, 0, dfc[,i])
    }

Discussions similaires

  1. Extraire une sous data.frame
    Par manoir dans le forum R
    Réponses: 4
    Dernier message: 10/07/2009, 14h39
  2. Dupliquer les lignes d'une data. frame
    Par manoir dans le forum R
    Réponses: 2
    Dernier message: 09/07/2009, 18h25
  3. Mean par colonne dans une data frame
    Par manoir dans le forum R
    Réponses: 3
    Dernier message: 19/06/2009, 11h06
  4. Trier une data frame
    Par manoir dans le forum R
    Réponses: 4
    Dernier message: 28/04/2009, 16h29
  5. Réponses: 2
    Dernier message: 14/11/2008, 14h53

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo