IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Parser HTML et Beautiful Soup


Sujet :

Python

Mode arborescent

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Invité
    Invité(e)
    Par défaut Parser HTML et Beautiful Soup
    Bonjour,

    après un passage dans Beautiful Soup d'une page web, voici une partie du code source de la page web :

    Code HTML : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    <table class="rapports">
    <tr class="head">
    <th class="center" colspan="3">Rapports Officiels Loto Foot 15*</th>
    </tr>
    <tr>
    <td>14 sur 14</td><td>3</td><td class="right">333 334*€</td>
    </tr>
    <tr class="row_gtc">
    <td>13 sur 14</td><td>212</td><td class="right">1 221*€</td>
    </tr>
    <tr>
    <td>12 sur 14</td><td>2811</td><td class="right">92,0*€</td>
    </tr>
    <tr class="row_gtc">
    <td>11 sur 14</td><td>18902</td><td class="right">13,6*€</td>
    </tr><tr><td class="small" colspan="3">Gains distribués : 1 774 533*€<br/>* source: fdj.com</td></tr></table><table class="rapports histlf7"><tr class="head"><th>Nombre 1</th><th>Nombre N</th><th>Nombre 2</th></tr><tr><td>7</td><td>5</td><td>2</td></tr></table><table class="rapports"><tr class="head"><th>Cons. 1</th><th>Cons. N</th><th>Cons. 2</th></tr><tr><td>2</td><td>3</td><td>1</td></tr></table><table class="rapports histlf7"><tr class="head"><th>Diagonales</th><th>Symétries</th><th>Alternances</th></tr><tr><td>1</td><td>4</td><td>9</td></tr></table><table class="rapports"><tr class="head"><th>Paires</th><th>Tiercés</th><th>Quartés</th></tr><tr><td>7</td><td>12</td><td>11</td></tr></table>

    J'ai vu avec Beautiful Soup, que je peux récupérer le contenu d'une balise en spécifiant son nom, avec ca :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    combi = htmlsrc.find("table", { "class" : "rapports histlf7" })
    ce code me permet de faire une recherche dans la table rapports histlf7,

    mais dans le code source ci-dessus, on voit qu'il y a 2 tableaux qui se nomment pareil...(rapports histlf7)
    Même problème avec la table class "rapports"

    D'où ma question, comment accéder uniquement au 2ème ?
    Dernière modification par Invité ; 15/10/2014 à 23h33. Motif: Coloration syntaxique [code=HTML] ... [/code]

Discussions similaires

  1. [HELP] Modélisation d'un parser HTML
    Par dazulu dans le forum Langages de programmation
    Réponses: 11
    Dernier message: 31/07/2006, 01h03
  2. [VB]parser HTML
    Par wehtam dans le forum VB 6 et antérieur
    Réponses: 8
    Dernier message: 31/01/2006, 23h26
  3. Parser HTML
    Par Mucsy dans le forum MFC
    Réponses: 3
    Dernier message: 02/01/2006, 15h49
  4. [Système] Existe-t-il un bon parser HTML pour PHP ?
    Par MiJack dans le forum Langage
    Réponses: 8
    Dernier message: 25/10/2005, 11h18
  5. [Parser HTML] quel parser utiliser pour du HTML 4.0 ?
    Par Cyber@l dans le forum API standards et tierces
    Réponses: 5
    Dernier message: 19/07/2004, 19h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo