BeautifulSoup - find_all()
Bonjour,
Je bloque pour extraire certaines données de la page HTML ci-dessous :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
| <!DOCTYPE html>
<html>
<head>
<title>Exercice extraction HTML</title>
</head>
<body>
<h1>Bienvenue sur notre site web</h1>
<p>Voici une liste de nos produits :</p>
<ul>
<li>
<h2>Produit 1</h2>
<p>Prix : 10</p>
<p>Description : Lorem ipsum dolor sit amet, consectetur adipiscing elit.</p>
</li>
<li>
<h2>Produit 2</h2>
<p>Prix : 20</p>
<p>Description : Sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.</p>
</li>
<li>
<h2>Produit 3</h2>
<p>Prix : 30</p>
<p>Description : Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.</p>
</li>
</ul>
</body>
</html> |
Comment faire pour extraire seulement les prix ? soit les balises <p> à l'intérieur des balises <ul>.
Ça doit être tout bête mais je bloque malgré mes recherches.
J'ai essayé de rentrer différents critères avec soup.find_all('p', attrs={"class": "class_name", "id": "id_name"}) mais impossible.