Bonjour,
J'ai un problème dans mon script qui scanne automatiquement une page possédant un tableau. Le tableau comporte une entête avec le mot "Température". Le but est de récupérer seulement cette colonne. Lorsque je lance mon script par Rstudio tout marche mais quand je le lance par la console windows par R.exe il ne reconnait plus le caractère "é".
J'ai essayé de décomposer mon mot avec un Unicode :
Code : Sélectionner tout - Visualiser dans une fenêtre à part paste0("Temp", "\\U00E9", "rature")
Code : Sélectionner tout - Visualiser dans une fenêtre à part paste0("Temp", "\U00E9", "rature")
Code : Sélectionner tout - Visualiser dans une fenêtre à part paste0("Temp\\U00E9", "rature")J'ai aussi changé mon encoding soit en Latin-1 soit en UTF-8.
Code : Sélectionner tout - Visualiser dans une fenêtre à part "Temp\\U00E9rature"
Mais tout ça rien n'y fait...
Voici mon bout de code :
Dans l'attente de recevoir une réponse,
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 page <- read_html(url_infoclimat, encoding="latin-1") header <- html_nodes(page, xpath = xpath_line)[1] header_names <- header %>% html_nodes(xpath = "th") %>% html_text %>% str_trim index_colonne_temp <- which(header_names == paste0("Temp", "\\U00E9", "rature")) xpath_temp <- paste0("td[", index_colonne_temp, "]")
Merci beaucoup d'avance !
Bento
Partager