Bonsoir à tous,
J'ai deux petit soucis sur R, je suis débutant et me prend parfois le chou pour des fonctions simples
Voici mon premier soucis, je dispose d'un dataframe comportant plusieurs colonnes, je voudrais faire une opération simple sur 2 de ces colonnes : la colonne "Date" et la colonne " Calculate"
Ci dessous un exemple du tableau :
Date Calculate
2017-06-03 12:30:25 128
2017-06-02 22:30:21 345
2017-06-01 10:16:36 1060
2017-06-01 10:15:22 452
2017-06-01 10:00:12 N/A
Le champs Date est sous le format "YYYY-MM-DD HH:MM:SS"
Le champ Calculate contient parfois des champs vide (N/A)
Je voudrais étudier la distribution de la colonne calculate en fonction du temps (sachant que plusieurs valeur sont disponible pour une même date), avez vous une suggestion pour pouvoir voir cette distribution graphiquement ? J'ai regardé du côté de la library ggplot2 mais je n'ai pas réussi .. (il est à noter que mes dates sont dans l'ordre décroissante ds mon dataset cela impact-il la viz' ?)
Mon deuxième soucis est que j'aimerais récupérer au sein d'une colonne "message" comportant une chaine de caractère, un caractère particulier et le rajouter dans une autre colonne(NewColumn) que j'aurais crée, la valeur associée.
Exemple :
message NewColumn
[...] (10%)[...] 10
[...] (8%) [...] 8
[...](15%) [...] 15
"[...]" signifie juste une chaîne de caractère quelconque, j'ai crée une regex pour trouver ce qui m'intéresse (un pourcentage compris entre parenthèse), malheureusement je ne sais pas si ça m'est utile dans ce genre de problème.
Par avance je vous remercie
Partager