Développeurs, Développeuses,
Je rencontre un problème sur de la manipulation de données.
Voici un extrait de data.frame :
Je souhaiterais supprimer les doublons sur le prenom, Activite, Lieu mais garder la dernière date (max) de cet élément.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5 (d <- data.frame( Prenom= rep('Jean',3), Activite= rep('Foot',3), Lieu=rep('Marseille',3), Date=c(Sys.Date(),Sys.Date()+1,Sys.Date()+2))) Prenom Activite Lieu Date 1 Jean Foot Marseille 2019-03-13 2 Jean Foot Marseille 2019-03-14 3 Jean Foot Marseille 2019-03-15
J'avais bien pensé à passer par :
Qui me renvoie logiquement la première ligne et donc la première date et non la date max souhaitée.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 doublons <- which(duplicated(d[,c(1,2,3)])) (d1 <- d[-doublons,]) Prenom Activite Lieu Date 1 Jean Foot Marseille 2019-03-13
J'imagine que l'on pourrait manipuler le dataframe de base en faisant un tri par ordre décroissant sur la colonne en question, puis faire ces mêmes instructions, mais ce n'est surement pas le plus optimal (peut-être une option dans le which?).
Bonne journée à tous et d'avance merci
Partager