Bonjour,
Je bloque pour extraire certaines données de la page HTML ci-dessous :
Code html : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27 <!DOCTYPE html> <html> <head> <title>Exercice extraction HTML</title> </head> <body> <h1>Bienvenue sur notre site web</h1> <p>Voici une liste de nos produits :</p> <ul> <li> <h2>Produit 1</h2> <p>Prix : 10</p> <p>Description : Lorem ipsum dolor sit amet, consectetur adipiscing elit.</p> </li> <li> <h2>Produit 2</h2> <p>Prix : 20</p> <p>Description : Sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.</p> </li> <li> <h2>Produit 3</h2> <p>Prix : 30</p> <p>Description : Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.</p> </li> </ul> </body> </html>
Comment faire pour extraire seulement les prix ? soit les balises <p> à l'intérieur des balises <ul>.
Ça doit être tout bête mais je bloque malgré mes recherches.
J'ai essayé de rentrer différents critères avec soup.find_all('p', attrs={"class": "class_name", "id": "id_name"}) mais impossible.
Partager