BeautifulSoup - Recherche de données dans une page web
Bonjour,
Tout d'abord, je tiens à préciser que je débute en Python.
Je cherche à récupérer des infos (Nom du film, nom du réalisateur, note …) dans une page web dont voici un extrait :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
| <!-- element -->
<div class="t12-crilst-item">
<p class="clear"> </p>
<figure>
<img src="http://medias-telerama.sdv.fr/cinemovies/posters/24072/tn-les-enfants-de-belle-ville-24072-575331289.jpg" alt="Les Enfants de Belle Ville">
</figure>
<div class="t12-crilst-crit">
<p class="t12-crilst-ulysse"><img src="http://icon-telerama.sdv.fr/label/cinema/grand/4.png" alt="On aime beaucoup" title="On aime beaucoup" border="0" /></p>
<p class="t12-crilst-avis">
<a href="/cinema/films/les-enfants-de-belle-ville,434279.php">L'essentiel</a><br />
<a href="/cinema/films/les-enfants-de-belle-ville,434279,critique.php">Critique</a><br />
<a href="/cinema/films/les-enfants-de-belle-ville,434279,seances.php">Séances</a><br />
<a href="/cinema/films/les-enfants-de-belle-ville,434279,bande-annonce.php">Bandes-annonces</a><br />
<a href="/cinema/films/les-enfants-de-belle-ville,434279,avis-spectateurs.php">Vos avis</a><br />
<a href="/cinema/films/les-enfants-de-belle-ville,434279,photos.php">Galerie photos</a><br />
</p>
</div>
<!--t12-crilst-crit-->
<blockquote>
<p class="t12-crilst-tit">
<a href="/cinema/films/les-enfants-de-belle-ville,434279.php">Les Enfants de Belle Ville (Shahr - Eziba) réalisé par Asghar Farhadi </a>
</p>
<p class="t12-crilst-chapo">
Drame avec Hossein Farzi-Zadeh et Taraneh Alidousti et Babak Ansari et Faramars Gharibian et Ahoo Kheradmand et Farhad Ghaiemian et Hooshang Heyhavand (1h41min) </p>
<p class="t12-crilst-txt">
Le film est de 2004 mais on y sent déjà, en germe, ce qui fera le succès d'« Une séparation » : un scénario très écrit, qui met en scène un dilemme. Un jeune homme est condamné à mort. Obtiendra-t-on sa grâce ? Lois civile et religieuse s'enchevêtrent dans un récit à suspense, toujours passionnant. </p>
</blockquote>
<p class="clear"> </p>
</div>
<!-- /element --> |
En faisant des recherches, j'ai pu me rendre compte que c'était une requête assez courante.
Je voudrais le faire avec BeautifulSoup, mais je n'y arrive pas pour l'instant.
Ce que je ne comprends pas, c'est comment repérer l'objet que je souhaite récupérer.
J'ai vu qu'on pouvait le faire avec DOM Inspector (http://www.developpez.net/forums/d32...beautifulsoup/), mais DOM Inspector ne propose pas de TAG pour l'objet que je souhaite récupérer …
Quelqu'un pourrait il me mettre sur la voie ?
Merci d'avance.