Parser HTML et Beautiful Soup

Invité · 07/10/2014, 19h57

Bonjour,

après un passage dans Beautiful Soup d'une page web, voici une partie du code source de la page web :

Code HTML :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
<table class="rapports">
<tr class="head">
<th class="center" colspan="3">Rapports Officiels Loto Foot 15*</th>
</tr>
<tr>
<td>14 sur 14</td><td>3</td><td class="right">333 334*€</td>
</tr>
<tr class="row_gtc">
<td>13 sur 14</td><td>212</td><td class="right">1 221*€</td>
</tr>
<tr>
<td>12 sur 14</td><td>2811</td><td class="right">92,0*€</td>
</tr>
<tr class="row_gtc">
<td>11 sur 14</td><td>18902</td><td class="right">13,6*€</td>
</tr><tr><td class="small" colspan="3">Gains distribués : 1 774 533*€<br/>* source: fdj.com</td></tr></table><table class="rapports histlf7"><tr class="head"><th>Nombre 1</th><th>Nombre N</th><th>Nombre 2</th></tr><tr><td>7</td><td>5</td><td>2</td></tr></table><table class="rapports"><tr class="head"><th>Cons. 1</th><th>Cons. N</th><th>Cons. 2</th></tr><tr><td>2</td><td>3</td><td>1</td></tr></table><table class="rapports histlf7"><tr class="head"><th>Diagonales</th><th>Symétries</th><th>Alternances</th></tr><tr><td>1</td><td>4</td><td>9</td></tr></table><table class="rapports"><tr class="head"><th>Paires</th><th>Tiercés</th><th>Quartés</th></tr><tr><td>7</td><td>12</td><td>11</td></tr></table>

J'ai vu avec Beautiful Soup, que je peux récupérer le contenu d'une balise en spécifiant son nom, avec ca :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

combi = htmlsrc.find("table", { "class" : "rapports histlf7" })

ce code me permet de faire une recherche dans la table rapports histlf7,

mais dans le code source ci-dessus, on voit qu'il y a 2 tableaux qui se nomment pareil...(rapports histlf7)
Même problème avec la table class "rapports"

D'où ma question, comment accéder uniquement au 2ème ?

Parser HTML et Beautiful Soup

Python

Mode arborescent

Discussions similaires

Partager

Partager