Bonjour à tous,
je débute en Python et je souhaite extraire d'un site internet à URL changeant, des données (en l'occurrence, des titres d'articles) .
Quand je dis que l'URL change, c'est que des articles sont sur la page 1, la suite sur la page 2 etc et donc que l'URL se modifie en conséquence .
J'ai donc codé le script ci dessous . Celui ci fonctionne mais uniquement pour une page . Visiblement la boucle ne fonctionne pas ou bien l'erreur est ailleurs
merci pour votre aide !
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17 -------------------------------------------------------------- import requests from bs4 import BeautifulSoup as bs URL = "https://www.medincell.com/fr/2022/page/" for pages in range(0,2): req = requests.get(URL + str(pages) + '/') soup = bs(req.text, 'html.parser') class_name= "read_more" titles = soup.find_all('p',class_=class_name) titles -------------------------------------------
Matthieu
Partager