Bonsoir à tous,
Je tiens tout d'abord à m'excuser si je ne poste pas au bon endroit, je suis actuellement en train de m'arracher les cheveux sur un problème qui je suis sûr est tout simple
Je dispose d'un .csv comportant plusieurs colonnes (que j'ai bien évidemment chargé en data frame sous R), pour mon étude 2 colonnes m'intéresse, "Date" & "Nom"
La colonne "Date" comporte des éléments sous le format ci-dessous :
JJ/MM/AAAA HH:MM:SS soit par exemple 01/02/2016 12:20:30 soit le premier février 2016 à 12h20 min 30s
A cette ligne est associé sur la colonne suivante "Nom", comportant le nom d'une personne (Ex : Jean ).
Ce que je voudrais faire, c'est de calculer toutes les heures (pour chaque jour du mois de février), le nombre de personne associées. Je ne sais pas si c'est clair mais je vais faire un exemple pour illustrer mon propos :
DATE Nom
01/02/2016 12:20:30 Jean
01/02/2016 12:40:02 Pierre
01/02/2016 12:46:00 Sylvain
01/02/2016 12:55:30 Pierre
01/02/2016 12:58:07 Jean
01/02/2016 13:05:30 Nathalie
01/02/2016 14:20:30 Florence
Je voudrais du coups que ma fonction m'indique que le 01/02/2016, entre 12h et 13h, il y'a les "scores" suivant : Jean : 2 / Pierre : 2 / Sylvain : 1
entre 13h et 14 h : Nathalie : 1 etc ... jusqu'au jour suivant.
Comme vous pouvez le constater le problème semble simple, mais je peux vous assurer que sa simplicité m'a perturbé au point d'en être bloqué..
Par avance je remercie l'âme charitable que voudra bien prendre un peu de son temps pour aider une personne qui fait ses premières gammes sous R.
N.B : Est-ce que le fait d'avoir un jeu de donnée de près de 4,5k lignes posera problème pour ma fonction en terme de performance ? (reparcours plusieurs fois le tableau par exemple)
Partager