IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Aide beautifulsoup néofite


Sujet :

Python

  1. #1
    Membre du Club
    Inscrit en
    Avril 2008
    Messages
    369
    Détails du profil
    Informations forums :
    Inscription : Avril 2008
    Messages : 369
    Points : 61
    Points
    61
    Par défaut Aide beautifulsoup néofite
    Bonjour,

    Je suis néofite en langage python. A vrai dire, je m'y suis mis aujourd'hui...
    Je souhaite récupérer des données présentes sur trois pages web afin de constituer un fichier txt.
    J'ai réussis à en faire une partie (je pense que c'est très mal écrit mais le principal c'est que ça tourne à défaut de mieux). Pour scrapper les donnée, j'ai utilisé beautifulSoup.
    Je laisse le code pour plus de clarté.
    Si vous le lancez, vous devriez avoir un fichier généré avec la première partie (les données de la première page).
    Par contre, même après mes recherches, je ne trouve aucune explication.
    Les données de la seconde page ne sont pas toutes interprétées ... On dirait que seule la première ligne du tableau est récupérée.
    Auriez vous une piste à me fournir svp ?

    Merci par avance


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    135
    136
    137
    138
    139
    140
    141
    142
    143
    144
    145
    146
    147
    148
    149
    150
    151
    152
    153
    154
    155
    156
    157
    158
    159
    160
    161
    162
    163
    164
    165
    166
    167
    168
    169
    170
    171
    172
    173
    174
    175
    176
    177
    178
    179
    180
    181
    182
    183
    184
    185
    186
    187
    188
    189
    190
    191
    192
    193
    194
    195
    196
    197
    198
    199
    200
    201
    202
    203
    204
    205
    206
    207
    208
    209
    210
    211
    212
    213
    214
    215
    216
    217
    218
    219
    220
    221
    222
    223
    224
    225
    226
    227
    228
    229
    230
    231
    232
    233
    234
    235
    236
    237
    238
    239
    240
    241
    242
    243
    244
    245
    246
    247
    248
    249
    250
    251
    252
    253
    254
    255
    256
    257
    258
    259
    260
    261
    262
    263
    264
    265
    266
    267
    268
    269
    270
    271
    272
    273
    274
    275
    276
    277
    278
    279
    280
    281
    282
    283
    284
    285
    286
    287
    288
    289
    290
    291
    292
    293
    294
    295
    296
    297
    298
    299
    300
    301
    302
    303
    304
    305
    306
    307
    308
    309
    310
    311
    312
    313
    314
    315
    316
    317
    318
    319
    320
    321
    322
    323
    324
    325
    326
    327
    328
    329
    330
    331
    332
    333
    334
    335
    336
    337
    338
    339
    340
    341
    342
    343
    344
    345
    346
    347
    348
    349
    350
    351
    352
    353
    354
    355
    356
    357
    358
    359
    360
    361
    362
    363
    364
    365
    366
    367
    368
    369
    370
    371
    372
    373
    374
    375
    376
    377
    378
    379
    380
    381
    382
    383
    384
    385
    386
    387
    388
    389
    390
    391
    392
    393
    394
    395
    396
    397
    398
    399
    400
    401
    402
    403
    404
    405
    406
    407
    408
    409
    410
    411
    412
    413
    414
    415
    416
    417
    418
    419
    420
    421
    422
    423
    424
    425
    426
    427
    428
    429
    430
    431
    432
    433
    434
    435
    436
    437
    438
    439
    440
    441
    442
    443
    444
    445
    446
    447
    448
    449
    450
    451
    452
    453
    454
    455
    456
    457
    458
    459
    460
    461
    462
    463
    464
    465
    466
    467
    468
    469
    470
    471
    472
    473
    474
    475
    476
    477
    478
    479
    480
    481
    482
    483
    484
    485
    486
    487
    488
    489
    490
    491
    492
    493
    # -*- coding:utf-8 -*-
     
    import bs4
    import re
    import urllib.request
    import datetime
    import time
    import codecs
     
    date_du_jour = datetime.date.today()
    duree_de_un_jour = datetime.timedelta(1) # Représente la durée d'une journée
    demain = date_du_jour + duree_de_un_jour
     
    #print(str(demain.day) + "-" + str(demain.month) + "-" + str(demain.year))
     
    forebet_url_1x2 = 'https://www.forebet.com/fr/previsions-de-football-pour-demain'
    forebet_url_btts = 'https://www.forebet.com/fr/previsions-de-football-pour-demain/chaque-equipe-marque'
    forebet_url_plus_moins = 'https://www.forebet.com/fr/previsions-de-football-pour-demain/moins-plus-2-5-de-buts'
     
    nom_fic = "Confiance "+str(demain.day)+"-"+str(demain.month)+"-"+str(demain.year)+".txt"
    fichier = open(nom_fic, "a")	#on met à jour le fichier
    fichier.write("1X2 (>= 55%)\n\n") #init de la partie 1X2
    fichier.close()
     
    #-------------------------------------#       
    #Partie tableau 1X2 du fichier
    #-------------------------------------#
    with urllib.request.urlopen(forebet_url_1x2) as f:
        data = f.read().decode('utf-8')
        page = bs4.BeautifulSoup(data, 'html.parser')
     
        increment = 0
     
        #-------------------------------------#       
        #Partie tableau impair
        #-------------------------------------#
        for item in page.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_0'}).find_all("td"):
            #print("item : ",item)
            #print("nb colonne : ",len(item))
            #print("texte : ",str(item.getText()))
            #print("nom : ",item.name, "\n-------")
     
            if len(item) == 9 :
                #init
                increment = 0
                flag_nul = 0
                pourc_a_garder = 0
     
                match = item.find('a')
                if match is None :
                    continue
     
                lien_rencontre = match.get("href")
                recontre = match.get_text(' ', strip=True)
                #print("lien : ",lien_rencontre)
                #print("texte lien : ",recontre)
            #print(item.getText(), "\n-------")
            #print("texte: ",item.get_text(' ', strip=True), "\n-------")
     
            increment = increment + 1
     
            #print ("inc : ",increment)
     
            #Récupération du pourcentage de la victoire de l'équipe à domicile
            if increment == 2 :
                pour_domicile = item.get_text(' ', strip=True)
                #print("pourcentage domicile : ",pour_domicile)
     
            #Récupération du pourcentage du match nul
            if increment == 3 :
                pour_nul = item.get_text(' ', strip=True)
                #print("pourcentage nul : ",pour_nul)
     
            #Récupération du pourcentage de la victoire de l'équipe à domicile
            if increment == 4 :
                pour_exterieur = item.get_text(' ', strip=True)
                #print("pourcentage exterieur : ",pour_exterieur)
     
            #Récupération du pourcentage de la prediction
            if increment == 5 :
                prediction = item.get_text(' ', strip=True)
                #print("prediction : ",prediction)
     
                if prediction == '1' :
                    pourc_a_garder = str(pour_domicile)
     
                if prediction == '2' :
                    pourc_a_garder = str(pour_exterieur)
     
                if prediction == 'X' :
                    pourc_a_garder = str(pour_nul)
                    flag_nul = 1
     
                #print("pourcentage prediction : ",pourc_a_garder)
     
                #Consitution d'une ligne du fichier
                #print(pourc_a_garder)
     
                if pourc_a_garder >= '55' and flag_nul == 0 :
                    ligne = str(recontre)+" ("+str(prediction)+"-"+str(pourc_a_garder)+"%)\n"
                    #print(str(ligne))
                    #fichier = open(nom_fic, "a")	#on met à jour le fichier
                    fichier = codecs.open(nom_fic,"a","utf-8")
                    fichier.write(ligne) #valorisation de la partie 1X2
                    fichier.close()
     
        #-------------------------------------#       
        #Partie tableau pair
        #-------------------------------------#
     
        for item in page.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_1'}).find_all("td"):
            #print("item : ",item)
            #print("nb colonne : ",len(item))
            #print("texte : ",str(item.getText()))
            #print("nom : ",item.name, "\n-------")
     
            if len(item) == 9 :
                #init
                increment = 0
                flag_nul = 0
                pourc_a_garder = 0
     
                match = item.find('a')
                if match is None :
                    continue
     
                lien_rencontre = match.get("href")
                recontre = match.get_text(' ', strip=True)
                #print("lien : ",lien_rencontre)
                #print("texte lien : ",recontre)
            #print(item.getText(), "\n-------")
            #print("texte: ",item.get_text(' ', strip=True), "\n-------")
     
            increment = increment + 1
     
            #print ("inc : ",increment)
     
            #Récupération du pourcentage de la victoire de l'équipe à domicile
            if increment == 2 :
                pour_domicile = item.get_text(' ', strip=True)
                #print("pourcentage domicile : ",pour_domicile)
     
            #Récupération du pourcentage du match nul
            if increment == 3 :
                pour_nul = item.get_text(' ', strip=True)
                #print("pourcentage nul : ",pour_nul)
     
            #Récupération du pourcentage de la victoire de l'équipe à domicile
            if increment == 4 :
                pour_exterieur = item.get_text(' ', strip=True)
                #print("pourcentage exterieur : ",pour_exterieur)
     
            #Récupération du pourcentage de la prediction
            if increment == 5 :
                prediction = item.get_text(' ', strip=True)
                #print("prediction : ",prediction)
     
                if prediction == '1' :
                    pourc_a_garder = str(pour_domicile)
     
                if prediction == '2' :
                    pourc_a_garder = str(pour_exterieur)
     
                if prediction == 'X' :
                    pourc_a_garder = str(pour_nul)
                    flag_nul = 1
     
                #print("pourcentage prediction : ",pourc_a_garder)
     
                #Consitution d'une ligne du fichier
                #print(pourc_a_garder)
     
                if pourc_a_garder >= '55' and flag_nul == 0 :
                    ligne = str(recontre)+" ("+str(prediction)+"-"+str(pourc_a_garder)+"%)\n"
                    print(str(ligne))
                    #fichier = open(nom_fic, "a")	#on met à jour le fichier
                    fichier = codecs.open(nom_fic,"a","utf-8")
                    fichier.write(ligne) #valorisation de la partie 1X2
                    fichier.close()
     
    #-------------------------------------#       
    #Partie tableau BTTS du fichier
    #-------------------------------------#
    with urllib.request.urlopen(forebet_url_btts) as f1:
        data1 = f1.read().decode('utf-8')
        page1 = bs4.BeautifulSoup(data1, 'html.parser')
     
        increment = 0
     
        fichier = open(nom_fic, "a")	#on met à jour le fichier
        fichier.write("\nBTTS (>= 65% - NO BTTS >= 80%) \n\n") #init de la partie BTTS
        fichier.close()
     
        #-------------------------------------#       
        #Partie tableau impair
        #-------------------------------------#
        for item_btts in page1.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_0'}).find_all("td"):
            print("item1 : ",item_btts)
            print("nb colonne : ",len(item_btts))
            print("texte : ",str(item_btts.getText()))
            print("nom : ",item_btts.name, "\n-------")
     
            if len(item_btts) == 7 :
                #init
                increment = 0
                flag_btts = 0
                flag_no_btts = 0
                pourc_a_garder = 0
                pour_btts = 0
                pour_no_btts = 0
     
                match = item_btts.find('a')
                if match is None :
                    continue
     
                lien_rencontre = match.get("href")
                recontre = match.get_text(' ', strip=True)
                #print("lien : ",lien_rencontre)
                #print("texte lien : ",recontre)
     
            increment = increment + 1
     
            print ("inc : ",increment)
     
            #Récupération du pourcentage d'un BTTS
            if increment == 2 :
                pour_btts = item_btts.get_text(' ', strip=True)[:-1]
                print("pourcentage btts : ",pour_btts)
     
            #Récupération du pourcentage d'un NO BTTS
            if increment == 3 :
                pour_no_btts = item_btts.get_text(' ', strip=True)[:-1]
                print("pourcentage no btts : ",pour_no_btts)
     
            #Déduction de la prediction
            #print("pourcentage btts : ",pour_btts," pourcentage no btts : ",pour_no_btts)
            if pour_btts == 0 or pour_no_btts == 0:
                    continue
     
            if str(pour_btts) >= str(pour_no_btts) :
                if pour_btts >= '65' :
                    chaine = "btts à "
                    flag_btts = 1
                    flag_no_btts = 0
                    pourc_a_garder = str(pour_btts)
     
            if str(pour_no_btts) >= str(pour_btts) :
                if pour_no_btts >= '80' :
                    chaine = "no btts à "
                    flag_btts = 0
                    flag_no_btts = 1
                    pourc_a_garder = str(pour_no_btts)
     
            print ("flag btts : ",flag_btts," flag no btts : ",flag_no_btts)
     
            if flag_btts == 1 or flag_no_btts == 1 :
                ligne = str(recontre)+" ("+str(chaine)+str(pourc_a_garder)+"%)\n"
                print(str(ligne))	
                fichier = codecs.open(nom_fic,"a","utf-8") #on met à jour le fichier
                fichier.write(ligne) #valorisation de la partie BTTS
                fichier.close()
     
        #-------------------------------------#       
        #Partie tableau pair
        #-------------------------------------#
        for item_btts2 in page1.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_0'}).find_all("td"):
            print("item2 : ",item_btts2)
            #print("nb colonne : ",len(item_btts2))
            #print("texte : ",str(item_btts2.getText()))
            #print("nom : ",item_btts2.name, "\n-------")
     
            if len(item_btts2) == 7 :
                #init
                increment = 0
                flag_btts = 0
                flag_no_btts = 0
                pourc_a_garder = 0
                pour_btts = 0
                pour_no_btts = 0
     
                match = item_btts2.find('a')
                if match is None :
                    continue
     
                lien_rencontre = match.get("href")
                recontre = match.get_text(' ', strip=True)
                #print("lien : ",lien_rencontre)
                #print("texte lien : ",recontre)
     
            increment = increment + 1
     
            if increment > 3 :
                continue
     
            #print ("inc : ",increment)
     
            #Récupération du pourcentage d'un BTTS
            if increment == 2 :
                pour_btts = item_btts2.get_text(' ', strip=True)[:-1]
                #print("pourcentage btts : ",pour_btts)
     
            #Récupération du pourcentage d'un NO BTTS
            if increment == 3 :
                pour_no_btts = item_btts2.get_text(' ', strip=True)[:-1]
                #print("pourcentage no btts : ",pour_no_btts)
     
            #Déduction de la prediction
            #print("pourcentage btts : ",pour_btts," pourcentage no btts : ",pour_no_btts)
            if pour_btts == 0 or pour_no_btts == 0:
                    continue
     
            if str(pour_btts) >= str(pour_no_btts) :
                if pour_btts >= '65' :
                    chaine = "btts à "
                    flag_btts = 1
                    flag_no_btts = 0
                    pourc_a_garder = str(pour_btts)
     
            if str(pour_no_btts) >= str(pour_btts) :
                if pour_no_btts >= '80' :
                    chaine = "no btts à "
                    flag_btts = 0
                    flag_no_btts = 1
                    pourc_a_garder = str(pour_no_btts)
     
            #print ("flag btts : ",flag_btts," flag no btts : ",flag_no_btts)
     
            if flag_btts == 1 or flag_no_btts == 1 :
                ligne = str(recontre)+" ("+str(chaine)+str(pourc_a_garder)+"%)\n"
                print(str(ligne))
                #fichier = open(nom_fic, "a")	
                fichier = codecs.open(nom_fic,"a","utf-8") #on met à jour le fichier
                fichier.write(ligne) #valorisation de la partie BTTS
                fichier.close()
     
    #-------------------------------------#       
    #Partie tableau +/- 2,5 buts du fichier
    #-------------------------------------#
    with urllib.request.urlopen(forebet_url_plus_moins) as f2:
        data2 = f2.read().decode('utf-8')
        page2 = bs4.BeautifulSoup(data2, 'html.parser')
     
        increment = 0
     
        fichier = open(nom_fic, "a")	#on met à jour le fichier
        fichier.write("\n+/- 2,5 buts ( PLUS >= 65% - MOINS >= 80%) \n\n") #init de la partie +/- 2,5 buts
        fichier.close()
     
        #-------------------------------------#       
        #Partie tableau impair
        #-------------------------------------#
        for item_plus_moins in page2.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_0'}).find_all("td"):
            #print("item3 : ",item_plus_moins)
            #print("nb colonne : ",len(item_plus_moins))
            #print("texte : ",str(item_plus_moins.getText()))
            #print("nom : ",item_plus_moins.name, "\n-------")
     
            if len(item_plus_moins) == 7 :
                #init
                increment = 0
                flag_plus = 0
                flag_moins = 0
                pourc_a_garder = 0
                pour_plus = 0
                pour_moins = 0
     
                match = item_plus_moins.find('a')
                if match is None :
                    continue
     
                lien_rencontre = match.get("href")
                recontre = match.get_text(' ', strip=True)
                #print("lien : ",lien_rencontre)
                #print("texte lien : ",recontre)
     
            increment = increment + 1
     
            if increment > 3 :
                continue
     
            #print ("inc : ",increment)
     
            #Récupération du pourcentage de + 2,5 buts
            if increment == 2 :
                pour_plus = item_plus_moins.get_text(' ', strip=True)[:-1]
                #print("pourcentage plus : ",pour_plus)
     
            #Récupération du pourcentage de - 2,5 buts
            if increment == 3 :
                pour_moins = item_plus_moins.get_text(' ', strip=True)[:-1]
                #print("pourcentage moins : ",pour_moins)
     
            #Déduction de la prediction
            #print("pourcentage plus : ",pour_plus," pourcentage moins : ",pour_moins)
            if pour_plus == 0 or pour_moins == 0:
                    continue
     
            if str(pour_plus) >= str(pour_moins) :
                if pour_plus >= '65' :
                    chaine = "plus à "
                    flag_plus = 1
                    flag_moins = 0
                    pourc_a_garder = str(pour_plus)
     
            if str(pour_moins) >= str(pour_plus) :
                if pour_moins >= '80' :
                    chaine = "moins à "
                    flag_plus = 0
                    flag_moins = 1
                    pourc_a_garder = str(pour_moins)
     
            #print ("flag plus : ",flag_plus," flag moins : ",flag_moins)
     
            if flag_plus == 1 or flag_moins == 1 :
                ligne = str(recontre)+" ("+str(chaine)+str(pourc_a_garder)+"%)\n"
                print(str(ligne))
                #fichier = open(nom_fic, "a")	
                fichier = codecs.open(nom_fic,"a","utf-8") #on met à jour le fichier
                fichier.write(ligne) #valorisation de la partie BTTS
                fichier.close()
     
        #-------------------------------------#       
        #Partie tableau pair
        #-------------------------------------#
        for item_plus_moins2 in page2.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_0'}).find_all("td"):
            #print("item4 : ",item_plus_moins2)
            #print("nb colonne : ",len(item_plus_moins2))
            #print("texte : ",str(item_plus_moins2.getText()))
            #print("nom : ",item_plus_moins2.name, "\n-------")
     
            if len(item_plus_moins2) == 7 :
                #init
                increment = 0
                flag_plus = 0
                flag_moins = 0
                pourc_a_garder = 0
                pour_plus = 0
                pour_moins = 0
     
                match = item_plus_moins2.find('a')
                if match is None :
                    continue
     
                lien_rencontre = match.get("href")
                recontre = match.get_text(' ', strip=True)
                #print("lien : ",lien_rencontre)
                #print("texte lien : ",recontre)
     
            increment = increment + 1
     
            if increment > 3 :
                continue
     
            #print ("inc : ",increment)
     
            #Récupération du pourcentage de + 2,5 buts
            if increment == 2 :
                pour_plus = item_plus_moins2.get_text(' ', strip=True)[:-1]
                #print("pourcentage plus : ",pour_plus)
     
            #Récupération du pourcentage de - 2,5 buts
            if increment == 3 :
                pour_moins = item_plus_moins2.get_text(' ', strip=True)[:-1]
                #print("pourcentage moins : ",pour_moins)
     
            #Déduction de la prediction
            #print("pourcentage plus : ",pour_plus," pourcentage moins : ",pour_moins)
            if pour_plus == 0 or pour_moins == 0:
                    continue
     
            if str(pour_plus) >= str(pour_moins) :
                if pour_plus >= '65' :
                    chaine = "plus à "
                    flag_plus = 1
                    flag_moins = 0
                    pourc_a_garder = str(pour_plus)
     
            if str(pour_moins) >= str(pour_plus) :
                if pour_moins >= '80' :
                    chaine = "moins à "
                    flag_plus = 0
                    flag_moins = 1
                    pourc_a_garder = str(pour_moins)
     
            #print ("flag plus : ",flag_plus," flag moins : ",flag_moins)
     
            if flag_plus == 1 or flag_moins == 1 :
                ligne = str(recontre)+" ("+str(chaine)+str(pourc_a_garder)+"%)\n"
                print(str(ligne))
                #fichier = open(nom_fic, "a")	
                fichier = codecs.open(nom_fic,"a","utf-8") #on met à jour le fichier
                fichier.write(ligne) #valorisation de la partie BTTS
                fichier.close()

  2. #2
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 287
    Points : 36 776
    Points
    36 776
    Par défaut
    Salut,

    Citation Envoyé par drogba72 Voir le message
    Les données de la seconde page ne sont pas toutes interprétées ... On dirait que seule la première ligne du tableau est récupérée.
    Auriez vous une piste à me fournir svp ?
    Votre soucis n'est pas dans le code ou dans l'utilisation de BeautifulSoup mais dans les éléments HTML sur lesquels se caler pour récupérer les informations souhaitées.
    Quand je dois galérer avec une page HTML, j'en récupère une copie en local, je l'ouvre avec Firefox et je lance l'inspector qui permet de voir la disposition de la page. D'un autre côté, je lance l'interpréteur Python, je charge le fichier HTML dans BS et je regarde le résultat des sélections qui font sens et j'ajuste...

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Membre du Club
    Inscrit en
    Avril 2008
    Messages
    369
    Détails du profil
    Informations forums :
    Inscription : Avril 2008
    Messages : 369
    Points : 61
    Points
    61
    Par défaut
    Bonjour,

    Merci tout d'abord pour votre réponse.
    Toutefois, je me permet de dire qu'elle ne m'a beaucoup avancé ou alors je n'ai pas compris ce que vous avez voulu mettre en avant.
    Je n'avais pas pensé à enregistrer la page en local. Néanmoins, j'utilise l'inspecteur directement sur la page hébergé, ce qui me permet de faire des tests et voir si le code fonctionne.
    Ma méconnaissance du langage fait qu'effectivement je pense avoir un problème avec bs4 mais il s'agit peut être d'autre chose.
    Ce que j'observe c'est qu'à l'appel du second with, le code ne se comporte plus de la même manière et je ne trouve rien sur cette observation sur le net.
    Avez vous connaissance d ece genre de problème ?

    Avez vous essayer le code que j'ai laissé sur mon premier post ? Si oui, vous verrezz tout de suite l'anomalie.

    Cordialement.

  4. #4
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 287
    Points : 36 776
    Points
    36 776
    Par défaut
    Citation Envoyé par drogba72 Voir le message
    Ce que j'observe c'est qu'à l'appel du second with, le code ne se comporte plus de la même manière et je ne trouve rien sur cette observation sur le net.
    Avez vous connaissance d ece genre de problème ?

    Avez vous essayer le code que j'ai laissé sur mon premier post ? Si oui, vous verrezz tout de suite l'anomalie.
    Désolé mais vous avez posté 500 lignes de code, pas le temps d'essayer de comprendre ce que vous avez essayé de faire, ni dans votre tête pour savoir si ce que vous obtenez est attendu. A vous de réduire et d'exposer le problème en quelques lignes (c'est en général comme çà que vous allez trouver sinon l'erreur au moins quelques mots clefs avec lesquels faire des recherches).

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  5. #5
    Membre du Club
    Inscrit en
    Avril 2008
    Messages
    369
    Détails du profil
    Informations forums :
    Inscription : Avril 2008
    Messages : 369
    Points : 61
    Points
    61
    Par défaut
    Encore merci pour votre temps

    Je viens d'appliquer vos derniers conseils et effectivement vous aviez certainement raison depuis le départ !!!
    Le problème ne vient pas du code mais de l'interprétation de la page HTML !! Par contre, je ne comprends pas d'où vient cette mauvaise interprétation ...

    En fait, lorsque j'effectue un l'instruction print(page1.find('table', {'class' : 'schema'})), cela m'affiche le tableau avec son entête et seulement le premier match (Alianza Petrolera vs Cortuluá).


    J'ai réduit le code comme vous m'avez demandé à la partie ci-dessous car la boucle sera certainement la solution

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    forebet_url_btts = 'https://www.forebet.com/fr/previsions-de-football-pour-demain/chaque-equipe-marque'
     
    with urllib.request.urlopen(forebet_url_btts) as f1:
        data1 = f1.read().decode('utf-8')
        page1 = bs4.BeautifulSoup(data1, 'html.parser')
     
        increment = 0
     
        print(page1.find('table', {'class' : 'schema'}))
     
        for item_btts in page1.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_0'}).find_all("td"):
            print("item1 : ",item_btts)

  6. #6
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 287
    Points : 36 776
    Points
    36 776
    Par défaut
    Citation Envoyé par drogba72 Voir le message
    Je viens d'appliquer vos derniers conseils et effectivement vous aviez certainement raison depuis le départ !!!
    Le problème ne vient pas du code mais de l'interprétation de la page HTML !! Par contre, je ne comprends pas d'où vient cette mauvaise interprétation ...
    Et ouais, c'est là que le boulot ch.... commence (et que je botte en touche en disant qu'à priori Python n'est pas concerné ce qui ne vous aide pas, je sais...).

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  7. #7
    Membre du Club
    Inscrit en
    Avril 2008
    Messages
    369
    Détails du profil
    Informations forums :
    Inscription : Avril 2008
    Messages : 369
    Points : 61
    Points
    61
    Par défaut
    Merci encore en espérant qu'un autre bon samaritain me donne un indice pour avancer

    Par contre, comment peut-on dire que python n'est pas concerné ?

  8. #8
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 287
    Points : 36 776
    Points
    36 776
    Par défaut
    Citation Envoyé par drogba72 Voir le message
    Par contre, comment peut-on dire que python n'est pas concerné ?
    Le fait est que les informations sont dans la page... mais on ne sait pas comment les adresser pour les récupérer facilement.... Et le temps que j'ai pu mettre pour arriver à trouver un adressage raisonnable pour certaines pages lorsque je me suis collé à cet exercice: c'est pas parce que c'est "compliqué" et "surprenant" que c'est la faute à Python ou à BS.
    Je suppose que ceux qui s'y adonnent régulièrement ont des outils qui permettant de trouver plus facilement (et c'est une question à poser dans un forum de la rubrique Web).

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. besoin aide - parser HTML - BeautifulSoup
    Par romses2 dans le forum Réseau/Web
    Réponses: 2
    Dernier message: 20/07/2007, 14h42
  2. Ajouter une aide
    Par Mailgifson dans le forum C++Builder
    Réponses: 5
    Dernier message: 12/06/2002, 13h32
  3. Besoin d'aide pour l'I.A. d'un puissance 4
    Par Anonymous dans le forum C
    Réponses: 2
    Dernier message: 25/04/2002, 17h05
  4. Une petite aide pour les API ?
    Par Yop dans le forum Windows
    Réponses: 2
    Dernier message: 04/04/2002, 21h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo