Bonjour,
Je suis en train de travailler sur regular expression en utilisant str_extract_all().
En gros, J'ai déjà eu le texte
Code html : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 <a href="/fr/Vins/Chateau-Roustaing-Reserve-Vieilles-Vignes-2016/p/477416.html" title="Château Roustaing Réserve Vieilles Vignes 2016"> <figure class="ns-Product-figure"><img class="ns-Product-img " src="http://medias.nicolas.com/media/sys_master/images/hfb/h24/8826453262366.png" alt="" title="Château Roustaing Réserve Vieilles Vignes 2016"/><figcaption class="ns-Product-title">Château Roustaing Réserve Vieilles Vignes 2016</figcaption></figure></a>
ce que je veux c'est d'extraire Château Roustaing Réserve Vieilles Vignes 2016 depuis le texte ci-dessus, sachant que le texte ci-dessus est une liste
voici le code de début pour avoir ce text
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 url = "http://www.nicolas.com/fr/Vins/c/01/?q=%3Arelevance%3AcolorCode%3AROUGE&text=#" nicolas<-htmlParse(url,encoding = "UTF-8") liste <- xpathSApply(nicolas,"//article/*/div/a") liste2 <- xpathSApply(nicolas,"//article/*/div/a[starts-with(./@title,'C')]")
j'ai essayé d'utiliser str_extract_all(liste,"[[:alpha:]]{1,}") mais voici le résultat
[[1]]
[1] "pointer" "x" "b"
[[2]]
[1] "pointer" "x" "a"
[[3]]
[1] "pointer" "x" "b"
[[4]]
[1] "pointer" "x" "e" "e"
Cela n'est pas ce que je veux, et je ne comprends pas d'où vient ce pointer
Merci beaucoup
Partager