IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

BeautifulSoup récupération 2 champs identiques [Python 3.X]


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre Expert
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 617
    Par défaut BeautifulSoup récupération 2 champs identiques
    Bonjour,
    J'ai un petit souci technique : des données apparaissent avec le même champ et je voudrais récupérer les 2 valeurs correspondantes.
    Voici un extrait de ma soupe :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    <table class="btable" data-table-export="true" data-table-export-format="csv,excel,print" data-table-export-nom="Total des types de bac par voeux" data-table-fixheader="false" data-table-page-info="false" data-table-pagination="false" id="statistiques_6451">
    <thead>
    <tr>
    <th data-colonne-filtre="select">Série de bac (ou diplômes équivalents)</th>
    <th data-colonne-filtre="select">Type de bac</th>
    <th class="indicateurs">Nombres de candidats</th>
    </tr>
    </thead>
    <tbody>
    <tr>
    <td>Séries du bac français</td>
    <td>Bac ES</td>
    <td class="chiffres">2</td>
    </tr>
    <tr>
    <td>Séries du bac français</td>
    <td>Bac Général</td>
    <td class="chiffres">17</td>
    </tr>
    <tr>
    <td>Séries du bac français</td>
    <td>Bac L</td>
    <td class="chiffres">1</td>
    </tr>
    <tr>
    <td>Séries du bac français</td>
    <td>Bac S</td>
    <td class="chiffres">5</td>
    </tr>
    <tr>
    <td>Diplômes étrangers</td>
    <td>Bac général</td>
    <td class="chiffres">4</td>
    </tr>
    <tr>
    Je voudrais par exemple récupérer les valeurs correspondant à "Bac Général", donc le 17 et le 4 (en fait, il y a d'autres champs et un champ peut apparaître 0 fois, 1 fois ou 2 fois maxi pour cette année).

    Pour l'instant, je bricolais avec cela qui fonctionnait car un champ n'apparaissait qu'une fois.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    soup21 = BeautifulSoup(contenu21, 'html.parser')
    tab21 = soup21.find_all('table', class_ = "btable")
    elem21 = []
    for el1 in tab21:
        el2_bis = el1.find_all("td")
        for el3_bis in el2_bis:
            if (el3_bis.text != "Séries du bac français" and el3_bis.text != "Diplômes étrangers"):
                elem21.append(el3_bis.text)
    elem21=[elem21[i:i+2] for i in range(0,len(elem21),2)]
    for el4 in elem21:
        if el4[0] == 'Bac général':
            liste_ETR_G = int(el4[1])
    Je sais que c'est pourri mais j'avais la flemme de tout refaire et au fur et à mesure de mes besoins, je l'ai adapté.
    J'imagine qu'il faudrait que je refasse tout avec ce que j'ai acqui au long de ces années mais pour l'instant je travaille dans l'urgence, donc en bricolant encore...

  2. #2
    Expert confirmé
    Avatar de jurassic pork
    Homme Profil pro
    Bidouilleur
    Inscrit en
    Décembre 2008
    Messages
    4 241
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Bidouilleur
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2008
    Messages : 4 241
    Par défaut
    hello,
    je n'ai peut-être pas bien compris ce que tu veux faire mais avec ce code :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    def parse_html_table(table):  
        for row in table.find_all('tr'):
            columns = row.find_all('td')
            if (len(columns) == 3 and
            columns[1].get_text().lower()  == 'bac général'):
                print(columns[2].get_text())
     
    soup = BeautifulSoup(contenu21,features="html.parser")
    tab21 = soup.find_all('table', class_ = "btable")
    for el1 in tab21:
        parse_html_table(el1)
    je récupère bien 17 et 4.

    Ami calmant, J.P

  3. #3
    Membre Expert
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 617
    Par défaut
    Merci beaucoup.
    Je voulais récupérer les champs en les distinguant bien.
    Du coup, ta fonction m'a bien servi. J'en ai profité pour faire un bon coup de ménage dans mon programme.
    Il n'est pas encore parfait mais est déjà plus lisible.
    Bonne semaine.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Requete croisant deux champs identiques
    Par sabotage dans le forum Langage SQL
    Réponses: 2
    Dernier message: 07/08/2005, 11h59
  2. Réponses: 16
    Dernier message: 17/06/2005, 15h51
  3. [JTextField] Récupération du champ
    Par cmoa59 dans le forum Composants
    Réponses: 3
    Dernier message: 22/04/2005, 10h24
  4. Récupération des champs d'un form dans un autre
    Par Crazyblinkgirl dans le forum ASP
    Réponses: 10
    Dernier message: 22/06/2004, 10h31
  5. plusieurs champs identiques en ligne
    Par viviking dans le forum Langage SQL
    Réponses: 12
    Dernier message: 18/06/2004, 11h25

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo