Bonjour !
J'ai besoin d'aide pour calculer des colonnes supplémentaires à mon dataframe.
Voici un exemple en modèle réduit correspondant à mon dataframe réel, avec :
- une colonne x (numérique)
- une colonne y (string)
- une colonne z (numérique)
Mon but serait de créer 3 colonnes correspondant à :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 x <- rnorm(30,mean = 5,sd = 1.5) y <- rep ( c("A","B","C","C","A") , 6 ) z <- rep ( c(1,2,3) , 10 ) DF <- data.frame (x,y,z)
- colonne4 : Nombre de y (exemple sur la première ligne, il s'agit du nombre de fois ou apparait "A" dans ma colonne y)
- colonne5 : La médiane de x par couple y et z (exemple sur la première ligne, on calcule la médiane de x des lignes 1; 10; 16 et 25 où "A" "1" apparaît).
- colonne6 : le nombre de fois ou apparaissent les couples y et z (exemple sur la première ligne, on calcule le nombre de fois ou le couple "A" ; "1" apparait sur les lignes, c'est à dire 4 fois).
Voici un tableau excel où je vous montre ce que ça donnerai (j'ai pas rempli toutes les cases) :
Je pense qu'on peut ajouter les colonnes avec cbind mais je ne sais pas comment faire pour calculer les valeurs et les placer dans mes nouvelles colonnes...Merci de votre aide, je cherche depuis ce matin mais mes tests ne fonctionnement pas !
Matou
Partager