traitement de données

**davidhac** · 26/05/2020, 12h01

Bonjour à tous,

Voici une partie de mon dataframe qui fait en réalité, plusieurs centaines de lignes :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
 
df <- data.frame(parcelle = c(11, 12, 11, 8, 11, 12),
                 ess1 = c("x", "y", "z", "z", "x", "y"),
                 nb1  = c(0,1,3,0,4,9),
                 ess2 = c("y","a","x","y","z","x"),
                 nb2 = c(5,4,1,5,6,0),
                 ess3  = c("x","z","z","a","y","x"),
                 nb3 = c(1,0,2,0,6,0))

Je souhaitais par la suite effectuer un résumé du dataframe ci-dessus.
Il s'agit ici de ne plus avoir de doublons de parcelles, sommer tous les nbX par parcelle et inverser le nom des colonnes (ess1, ess2, ess3) par leurs valeurs (a, x, y, z).
Voici la forme souhaitée :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
 
tab <- data.frame(parcelle = c(8, 11, 12),
                 a = c(0, 0, 4),
                 x = c(0, 6, 0),
                 y  = c(5, 11, 9),
                 z  = c(0, 11, 0))

De plus je souhaitais également diviser les valeurs obtenues dans tab pour chaque parcelle, par le nombre d'apparition des parcelles dans df.
Par exemple si dans df la parcelle 11 est apparue 30 fois, je souhaiterai diviser les valeurs de la ligne parcelle 11 par 30 dans tab.

J'ai tenté plusieurs approches avec les fonctions : pivot_wider, tapply, xtabs, mais je n'ai pas réussi à aboutir sur quelque chose de concret.

J'espère avoir été suffisamment clair.....

Merci pour vos réponses.
David

**mgdondon** · 26/05/2020, 13h38

Bonjour,

Merci pour votre question bien posée.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
df <- data.frame(parcelle = c(11, 12, 11, 8, 11, 12),
                 ess1 = c("x", "y", "z", "z", "x", "y"),
                 nb1  = c(0,1,3,0,4,9),
                 ess2 = c("y","a","x","y","z","x"),
                 nb2 = c(5,4,1,5,6,0),
                 ess3  = c("x","z","z","a","y","x"),
                 nb3 = c(1,0,2,0,6,0))

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
df <- rbind(setNames(df[,c(1,2,3)],c("parcelle","ess","nb")),
            setNames(df[,c(1,4,5)],c("parcelle","ess","nb")),
            setNames(df[,c(1,6,7)],c("parcelle","ess","nb")))

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
> df
   parcelle ess nb
1        11   x  0
2        12   y  1
3        11   z  3
4         8   z  0
5        11   x  4
6        12   y  9
7        11   y  5
8        12   a  4
9        11   x  1
10        8   y  5
11       11   z  6
12       12   x  0
13       11   x  1
14       12   z  0
15       11   z  2
16        8   a  0
17       11   y  6
18       12   x  0

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

tab <- reshape::cast(df, parcelle~ess, sum, value="nb")

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
> tab
  parcelle a x  y  z
1        8 0 0  5  0
2       11 0 6 11 11
3       12 4 0 10  0

De plus je souhaitais également diviser les valeurs obtenues dans tab pour chaque parcelle, par le nombre d'apparition des parcelles dans df.
Par exemple si dans df la parcelle 11 est apparue 30 fois, je souhaiterai diviser les valeurs de la ligne parcelle 11 par 30 dans tab.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
nbfreq <- as.data.frame(table(df$parcelle))
names(nbfreq) <- c("parcelle","Freq")
tab <- merge(tab, nbfreq, by="parcelle")
tab[,c("a","x","y","z")] <- tab[,c("a","x","y","z")] / tab[,"Freq"]

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
> tab
  parcelle         a         x        y        z Freq
1        8 0.0000000 0.0000000 1.666667 0.000000    3
2       11 0.0000000 0.6666667 1.222222 1.222222    9
3       12 0.6666667 0.0000000 1.666667 0.000000    6

Cordialement,

**davidhac** · 26/05/2020, 16h55

Merci beaucoup pour la rapidité ainsi que pour la pertinence de votre réponse.

Bien cordialement,
David

traitement de données

R

Discussions similaires

Partager

Partager