IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

traitement de données


Sujet :

R

  1. #1
    Membre à l'essai
    Homme Profil pro
    AgroParisTech
    Inscrit en
    Mai 2020
    Messages
    22
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 26
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : AgroParisTech
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Mai 2020
    Messages : 22
    Points : 19
    Points
    19
    Par défaut traitement de données
    Bonjour à tous,

    Voici une partie de mon dataframe qui fait en réalité, plusieurs centaines de lignes :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
    df <- data.frame(parcelle = c(11, 12, 11, 8, 11, 12),
                     ess1 = c("x", "y", "z", "z", "x", "y"),
                     nb1  = c(0,1,3,0,4,9),
                     ess2 = c("y","a","x","y","z","x"),
                     nb2 = c(5,4,1,5,6,0),
                     ess3  = c("x","z","z","a","y","x"),
                     nb3 = c(1,0,2,0,6,0))
    Je souhaitais par la suite effectuer un résumé du dataframe ci-dessus.
    Il s'agit ici de ne plus avoir de doublons de parcelles, sommer tous les nbX par parcelle et inverser le nom des colonnes (ess1, ess2, ess3) par leurs valeurs (a, x, y, z).
    Voici la forme souhaitée :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    tab <- data.frame(parcelle = c(8, 11, 12),
                     a = c(0, 0, 4),
                     x = c(0, 6, 0),
                     y  = c(5, 11, 9),
                     z  = c(0, 11, 0))
    De plus je souhaitais également diviser les valeurs obtenues dans tab pour chaque parcelle, par le nombre d'apparition des parcelles dans df.
    Par exemple si dans df la parcelle 11 est apparue 30 fois, je souhaiterai diviser les valeurs de la ligne parcelle 11 par 30 dans tab.

    J'ai tenté plusieurs approches avec les fonctions : pivot_wider, tapply, xtabs, mais je n'ai pas réussi à aboutir sur quelque chose de concret.


    J'espère avoir été suffisamment clair.....

    Merci pour vos réponses.
    David

  2. #2
    Membre expérimenté
    Inscrit en
    Novembre 2009
    Messages
    703
    Détails du profil
    Informations forums :
    Inscription : Novembre 2009
    Messages : 703
    Points : 1 311
    Points
    1 311
    Par défaut Transposition, agrégation
    Bonjour,

    Merci pour votre question bien posée.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    df <- data.frame(parcelle = c(11, 12, 11, 8, 11, 12),
                     ess1 = c("x", "y", "z", "z", "x", "y"),
                     nb1  = c(0,1,3,0,4,9),
                     ess2 = c("y","a","x","y","z","x"),
                     nb2 = c(5,4,1,5,6,0),
                     ess3  = c("x","z","z","a","y","x"),
                     nb3 = c(1,0,2,0,6,0))
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    df <- rbind(setNames(df[,c(1,2,3)],c("parcelle","ess","nb")),
                setNames(df[,c(1,4,5)],c("parcelle","ess","nb")),
                setNames(df[,c(1,6,7)],c("parcelle","ess","nb")))
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    > df
       parcelle ess nb
    1        11   x  0
    2        12   y  1
    3        11   z  3
    4         8   z  0
    5        11   x  4
    6        12   y  9
    7        11   y  5
    8        12   a  4
    9        11   x  1
    10        8   y  5
    11       11   z  6
    12       12   x  0
    13       11   x  1
    14       12   z  0
    15       11   z  2
    16        8   a  0
    17       11   y  6
    18       12   x  0
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    tab <- reshape::cast(df, parcelle~ess, sum, value="nb")
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    > tab
      parcelle a x  y  z
    1        8 0 0  5  0
    2       11 0 6 11 11
    3       12 4 0 10  0
    De plus je souhaitais également diviser les valeurs obtenues dans tab pour chaque parcelle, par le nombre d'apparition des parcelles dans df.
    Par exemple si dans df la parcelle 11 est apparue 30 fois, je souhaiterai diviser les valeurs de la ligne parcelle 11 par 30 dans tab.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    nbfreq <- as.data.frame(table(df$parcelle))
    names(nbfreq) <- c("parcelle","Freq")
    tab <- merge(tab, nbfreq, by="parcelle")
    tab[,c("a","x","y","z")] <- tab[,c("a","x","y","z")] / tab[,"Freq"]
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    > tab
      parcelle         a         x        y        z Freq
    1        8 0.0000000 0.0000000 1.666667 0.000000    3
    2       11 0.0000000 0.6666667 1.222222 1.222222    9
    3       12 0.6666667 0.0000000 1.666667 0.000000    6
    Cordialement,

  3. #3
    Membre à l'essai
    Homme Profil pro
    AgroParisTech
    Inscrit en
    Mai 2020
    Messages
    22
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 26
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : AgroParisTech
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Mai 2020
    Messages : 22
    Points : 19
    Points
    19
    Par défaut
    Merci beaucoup pour la rapidité ainsi que pour la pertinence de votre réponse.

    Bien cordialement,
    David

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [MySQL] PB traitement de données !
    Par Tr@nkill dans le forum PHP & Base de données
    Réponses: 6
    Dernier message: 05/04/2006, 11h36
  2. [Formulaires] Traitement des données dans une autre page...
    Par sekiryou dans le forum Général JavaScript
    Réponses: 3
    Dernier message: 04/03/2006, 09h08
  3. [PHP-JS] Traitement des données dans une autre page...
    Par sekiryou dans le forum Langage
    Réponses: 5
    Dernier message: 04/03/2006, 09h06
  4. traitement des données avant envoie dans MySQL
    Par italiasky dans le forum SQL Procédural
    Réponses: 13
    Dernier message: 07/02/2006, 22h50
  5. Programmation pour traitement de données
    Par benbois dans le forum Langages de programmation
    Réponses: 16
    Dernier message: 19/10/2005, 17h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo