Bonjour, nouveau sur R je sèche sur l'exploitation de données du type date/heures avec un champs "textuel".
Pour illustrer voici un exemple des valeurs du dataset :
J'ai un ensemble d'item à des heures différentes.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17 id;date;liste_item 1;18/02/2021 10:46:27;item1 2;18/02/2021 10:46:27;item2 3;18/02/2021 10:46:27;item1 4;18/02/2021 10:46:27;item1 5;18/02/2021 10:46:28;item2 6;18/02/2021 10:46:30;item2 7;18/02/2021 10:46:30;item2 8;18/02/2021 10:47:11;item3 9;18/02/2021 10:47:11;item2 10;18/02/2021 10:48:35;item2 11;18/02/2021 10:48:39;item2 12;18/02/2021 10:48:50;item2 13;18/02/2021 10:48:50;item3 14;18/02/2021 10:49:12;item2 15;18/02/2021 10:4934;item2
Je cherche à obtenir un histogramme avec le nombre d'item (la somme de l'ensemble des item) classé par minute d'une part et une courbe qui distinguerait le nombre distinct de ces 3 items par minute.
J'ai essayé de "feinter" mes lacunes en supprimant les secondes dans la colonne date et en faisant un group by du type :
Mais le résultat ne correspond pas à ce que je cherche...
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3 mydata %>% group_by(date) %>% summarise(Ndate = n_distinct(date),list_item)
Je vous remercie d'avance de vos lumières
Partager