Bonjour,
Je souhaite récupérer les 5 premières URL d'un site web, or les arguments de ma variable nb_pages ne semblent pas vouloir me renvoyer les informations demandées. Pour information l'éditeur de code que j'utilise ici est RStudio.
Ci-dessous le code concerné, je tiens à préciser que ceci est une reprise d'un code en open-source, et pour m'exercer au R j'essaye de la comprendre en corrigeant petit à petit les erreurs rencontrées, mais là je bloque. Certaines library que vous verrez ne sont pas nécessaires à l'exécution de ce bout de code, c'est en prémice de la suite lorsque j'aurais passé cette erreur :
Ci-dessous la réponse de la console :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32 library(httr) library(rvest) library(tidyverse) library(knitr) library(photon) go_GET <- function(url){ result=GET(url, add_headers( "User-Agent" = "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:62.0) Gecko/20100101 Firefox/62.0", "Accept"="text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8", "Accept-Language"="fr,fr-FR;q=0.8,en-US;q=0.5,en;q=0.3")) return(result) } go_GET("https://www.leboncoin.fr/ventes_immobilieres/offres/rhone_alpes/rhone/") url_base <- "https://www.leboncoin.fr/ventes_immobilieres/offres/rhone_alpes/rhone/" url_base_raw <- go_GET(url_base) html_base <- read_html(url_base_raw) nb_links <- html_base %>% html_nodes("._2ilNG") %>% html_text() %>% first() %>% str_replace(" ","") %>% as.numeric() nb_pages=ceiling(nb_links/35) pages=c(url_base, str_c(url_base,"p-",2:nb_pages)) pages[1:5]
En vous remerciant et en vous souhaitant une agréable journée,
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11 > pages=c(url_base, + str_c(url_base,"p-",2:nb_pages)) Error in 2:nb_pages : NA/NaN argument > pages[1:5] [1] "https://www.leboncoin.fr/ventes_immobilieres/offres/rhone_alpes/rhone/" [2] NA [3] NA [4] NA [5] NA >
Cordialement,
Partager