Bonjour,
Je suis novice en la matière (tant pour R que pour le web scrapping), mais je dois réaliser une extraction des petites annonces sur le site "leboncoin", et je suis arrivée à un stade où je bloque.
En réalité, je dois d'abord extraire sur une page du site LBC, la liste des liens http vers le contenu des petites annonces et je souhaite par la suite extraire ce contenu :
Et là ça ne marche pas, enfin ça marche lorsque que je récupère seulement "v" qui correspond à l'extraction de données sous forme de table, mais je souhaite récupérer aussi le contenu de la petite annonce sous forme de texte donc l'objet w, là, R me donne l'erreur suivante :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17 doc <- htmlParse ("http://www.leboncoin.fr/_maison_/offres/ile_de_france/?o=1") lien <- xpathSApply (doc, "//div[contains(@class,'list-lbc')]/a", xmlGetAttr, name = "href") # Jusque-là tout va bien, j'ai ma liste d'adresses dans l'objet "lien"# #je souhaite réaliser une boucle pour extraire toute les données avec la fonction For# v<-NULL w<-NULL for (i in 1:length(lien)) { extracteur<-function(url) lien[i]<-htmlParse(url) v[i]<- readHTMLTable(lien[i]) w[i]<-xpathSApply(lien[i],"//div[contains(@class='AdviewContents']/div[@class='contents']", xmlValue)}
Et je ne comprends pas parce que l'extraction de ce texte pour une seule annonce fonctionne, mais j'ai l'impression que la boucle ne marche pas...
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 Erreur dans UseMethod("xpathApply") : pas de méthode pour 'xpathApply' applicable pour un objet de classe "character"
Si quelqu'un a une idée je lui en serais vraiment reconnaissante.
Partager