comment extrait une chaîne de caractère dans une liste

Bonjour,

Je suis en train de travailler sur regular expression en utilisant str_extract_all().

En gros, J'ai déjà eu le texte

Code html :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
<a href="/fr/Vins/Chateau-Roustaing-Reserve-Vieilles-Vignes-2016/p/477416.html" title="Château Roustaing Réserve Vieilles Vignes 2016">
	<figure class="ns-Product-figure"><img class="ns-Product-img " src="http://medias.nicolas.com/media/sys_master/images/hfb/h24/8826453262366.png" alt="" title="Château Roustaing Réserve Vieilles Vignes 2016"/><figcaption class="ns-Product-title">Château Roustaing Réserve Vieilles Vignes 2016</figcaption></figure></a>

ce que je veux c'est d'extraire Château Roustaing Réserve Vieilles Vignes 2016 depuis le texte ci-dessus, sachant que le texte ci-dessus est une liste

voici le code de début pour avoir ce text

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
url = "http://www.nicolas.com/fr/Vins/c/01/?q=%3Arelevance%3AcolorCode%3AROUGE&text=#"
nicolas<-htmlParse(url,encoding = "UTF-8")
liste <- xpathSApply(nicolas,"//article/*/div/a")
liste2 <- xpathSApply(nicolas,"//article/*/div/a[starts-with(./@title,'C')]")

j'ai essayé d'utiliser str_extract_all(liste,"[[:alpha:]]{1,}") mais voici le résultat

[[1]]
[1] "pointer" "x" "b"

[[2]]
[1] "pointer" "x" "a"

[[3]]
[1] "pointer" "x" "b"

[[4]]
[1] "pointer" "x" "e" "e"

Cela n'est pas ce que je veux, et je ne comprends pas d'où vient ce pointer

Merci beaucoup

comment extrait une chaîne de caractère dans une liste

R

Mode arborescent

Discussions similaires

Partager

Partager