Bonjour !
Je suis confronté à un data.frame qui me pose soucis. Je dispose de données de hauteurs d'eau (3ème colonne) en fonction du temps (1ère et 2ème colonnes), rangées chronologiquement par pas de temps variables.
ex:
J'ai donc un data.frame de trois colonnes (1ère colonne: année, mois, jour). A la place d'avoir plusieurs valeurs par jour, j'aimerais avoir UNE valeur journalière. La méthode la plus simple serait de faire la moyenne des valeurs pour chaque jour. Pour être vraiment exact, il faudrait pondérer par les pas de temps variables, mais je ne veux pas non plus vous en demander trop numériquement...
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14 20000801 00:30 20.4 20000801 07:42 25.2 20000801 18:15 23.5 20000802 01:12 27.1 20000802 16:40 29.2 20000803 00:51 30.5 20000803 06:17 33.4 20000803 13:32 31.3 20000803 21:14 31.2 20000804 02:15 33.2 20000804 12:20 34.5 20000804 22:10 36.2 20000805 03:00 34.0 20000805 23:00 32.5
Du coup en moyennant simplement les valeurs horaires de chaque jour sans tenir compte des pas de temps variables, j'aimerais arriver à ça en reprenant l'exemple ci-dessus:
Lors de mon dernier post, ced m'a donné un outil très puissant "data.table" permettant de trier des data.frame. Je peux supposer que cet outil est capable de lire les dates de la 1ère colonne et alors trier les données en prenant en compte cette info. Mais je n'ai pas réussi à trouver de doc pertinente sur data.table. :s
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5 20000801 23.03 20000802 28.15 20000803 31.60 20000804 34.63 20000805 33.25
Merci d'avance pour toute aide donnée !![]()
Partager