Aide beautifulsoup néofite

**drogba72** · 29/04/2017, 01h13

Bonjour,

Je suis néofite en langage python. A vrai dire, je m'y suis mis aujourd'hui...
Je souhaite récupérer des données présentes sur trois pages web afin de constituer un fichier txt.
J'ai réussis à en faire une partie (je pense que c'est très mal écrit mais le principal c'est que ça tourne à défaut de mieux). Pour scrapper les donnée, j'ai utilisé beautifulSoup.
Je laisse le code pour plus de clarté.
Si vous le lancez, vous devriez avoir un fichier généré avec la première partie (les données de la première page).
Par contre, même après mes recherches, je ne trouve aucune explication.
Les données de la seconde page ne sont pas toutes interprétées ... On dirait que seule la première ligne du tableau est récupérée.
Auriez vous une piste à me fournir svp ?

Merci par avance

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
# -*- coding:utf-8 -*-
 
import bs4
import re
import urllib.request
import datetime
import time
import codecs
 
date_du_jour = datetime.date.today()
duree_de_un_jour = datetime.timedelta(1) # Représente la durée d'une journée
demain = date_du_jour + duree_de_un_jour
 
#print(str(demain.day) + "-" + str(demain.month) + "-" + str(demain.year))
 
forebet_url_1x2 = 'https://www.forebet.com/fr/previsions-de-football-pour-demain'
forebet_url_btts = 'https://www.forebet.com/fr/previsions-de-football-pour-demain/chaque-equipe-marque'
forebet_url_plus_moins = 'https://www.forebet.com/fr/previsions-de-football-pour-demain/moins-plus-2-5-de-buts'
 
nom_fic = "Confiance "+str(demain.day)+"-"+str(demain.month)+"-"+str(demain.year)+".txt"
fichier = open(nom_fic, "a")	#on met à jour le fichier
fichier.write("1X2 (>= 55%)\n\n") #init de la partie 1X2
fichier.close()
 
#-------------------------------------#       
#Partie tableau 1X2 du fichier
#-------------------------------------#
with urllib.request.urlopen(forebet_url_1x2) as f:
    data = f.read().decode('utf-8')
    page = bs4.BeautifulSoup(data, 'html.parser')
 
    increment = 0
 
    #-------------------------------------#       
    #Partie tableau impair
    #-------------------------------------#
    for item in page.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_0'}).find_all("td"):
        #print("item : ",item)
        #print("nb colonne : ",len(item))
        #print("texte : ",str(item.getText()))
        #print("nom : ",item.name, "\n-------")
 
        if len(item) == 9 :
            #init
            increment = 0
            flag_nul = 0
            pourc_a_garder = 0
 
            match = item.find('a')
            if match is None :
                continue
 
            lien_rencontre = match.get("href")
            recontre = match.get_text(' ', strip=True)
            #print("lien : ",lien_rencontre)
            #print("texte lien : ",recontre)
        #print(item.getText(), "\n-------")
        #print("texte: ",item.get_text(' ', strip=True), "\n-------")
 
        increment = increment + 1
 
        #print ("inc : ",increment)
 
        #Récupération du pourcentage de la victoire de l'équipe à domicile
        if increment == 2 :
            pour_domicile = item.get_text(' ', strip=True)
            #print("pourcentage domicile : ",pour_domicile)
 
        #Récupération du pourcentage du match nul
        if increment == 3 :
            pour_nul = item.get_text(' ', strip=True)
            #print("pourcentage nul : ",pour_nul)
 
        #Récupération du pourcentage de la victoire de l'équipe à domicile
        if increment == 4 :
            pour_exterieur = item.get_text(' ', strip=True)
            #print("pourcentage exterieur : ",pour_exterieur)
 
        #Récupération du pourcentage de la prediction
        if increment == 5 :
            prediction = item.get_text(' ', strip=True)
            #print("prediction : ",prediction)
 
            if prediction == '1' :
                pourc_a_garder = str(pour_domicile)
 
            if prediction == '2' :
                pourc_a_garder = str(pour_exterieur)
 
            if prediction == 'X' :
                pourc_a_garder = str(pour_nul)
                flag_nul = 1
 
            #print("pourcentage prediction : ",pourc_a_garder)
 
            #Consitution d'une ligne du fichier
            #print(pourc_a_garder)
 
            if pourc_a_garder >= '55' and flag_nul == 0 :
                ligne = str(recontre)+" ("+str(prediction)+"-"+str(pourc_a_garder)+"%)\n"
                #print(str(ligne))
                #fichier = open(nom_fic, "a")	#on met à jour le fichier
                fichier = codecs.open(nom_fic,"a","utf-8")
                fichier.write(ligne) #valorisation de la partie 1X2
                fichier.close()
 
    #-------------------------------------#       
    #Partie tableau pair
    #-------------------------------------#
 
    for item in page.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_1'}).find_all("td"):
        #print("item : ",item)
        #print("nb colonne : ",len(item))
        #print("texte : ",str(item.getText()))
        #print("nom : ",item.name, "\n-------")
 
        if len(item) == 9 :
            #init
            increment = 0
            flag_nul = 0
            pourc_a_garder = 0
 
            match = item.find('a')
            if match is None :
                continue
 
            lien_rencontre = match.get("href")
            recontre = match.get_text(' ', strip=True)
            #print("lien : ",lien_rencontre)
            #print("texte lien : ",recontre)
        #print(item.getText(), "\n-------")
        #print("texte: ",item.get_text(' ', strip=True), "\n-------")
 
        increment = increment + 1
 
        #print ("inc : ",increment)
 
        #Récupération du pourcentage de la victoire de l'équipe à domicile
        if increment == 2 :
            pour_domicile = item.get_text(' ', strip=True)
            #print("pourcentage domicile : ",pour_domicile)
 
        #Récupération du pourcentage du match nul
        if increment == 3 :
            pour_nul = item.get_text(' ', strip=True)
            #print("pourcentage nul : ",pour_nul)
 
        #Récupération du pourcentage de la victoire de l'équipe à domicile
        if increment == 4 :
            pour_exterieur = item.get_text(' ', strip=True)
            #print("pourcentage exterieur : ",pour_exterieur)
 
        #Récupération du pourcentage de la prediction
        if increment == 5 :
            prediction = item.get_text(' ', strip=True)
            #print("prediction : ",prediction)
 
            if prediction == '1' :
                pourc_a_garder = str(pour_domicile)
 
            if prediction == '2' :
                pourc_a_garder = str(pour_exterieur)
 
            if prediction == 'X' :
                pourc_a_garder = str(pour_nul)
                flag_nul = 1
 
            #print("pourcentage prediction : ",pourc_a_garder)
 
            #Consitution d'une ligne du fichier
            #print(pourc_a_garder)
 
            if pourc_a_garder >= '55' and flag_nul == 0 :
                ligne = str(recontre)+" ("+str(prediction)+"-"+str(pourc_a_garder)+"%)\n"
                print(str(ligne))
                #fichier = open(nom_fic, "a")	#on met à jour le fichier
                fichier = codecs.open(nom_fic,"a","utf-8")
                fichier.write(ligne) #valorisation de la partie 1X2
                fichier.close()
 
#-------------------------------------#       
#Partie tableau BTTS du fichier
#-------------------------------------#
with urllib.request.urlopen(forebet_url_btts) as f1:
    data1 = f1.read().decode('utf-8')
    page1 = bs4.BeautifulSoup(data1, 'html.parser')
 
    increment = 0
 
    fichier = open(nom_fic, "a")	#on met à jour le fichier
    fichier.write("\nBTTS (>= 65% - NO BTTS >= 80%) \n\n") #init de la partie BTTS
    fichier.close()
 
    #-------------------------------------#       
    #Partie tableau impair
    #-------------------------------------#
    for item_btts in page1.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_0'}).find_all("td"):
        print("item1 : ",item_btts)
        print("nb colonne : ",len(item_btts))
        print("texte : ",str(item_btts.getText()))
        print("nom : ",item_btts.name, "\n-------")
 
        if len(item_btts) == 7 :
            #init
            increment = 0
            flag_btts = 0
            flag_no_btts = 0
            pourc_a_garder = 0
            pour_btts = 0
            pour_no_btts = 0
 
            match = item_btts.find('a')
            if match is None :
                continue
 
            lien_rencontre = match.get("href")
            recontre = match.get_text(' ', strip=True)
            #print("lien : ",lien_rencontre)
            #print("texte lien : ",recontre)
 
        increment = increment + 1
 
        print ("inc : ",increment)
 
        #Récupération du pourcentage d'un BTTS
        if increment == 2 :
            pour_btts = item_btts.get_text(' ', strip=True)[:-1]
            print("pourcentage btts : ",pour_btts)
 
        #Récupération du pourcentage d'un NO BTTS
        if increment == 3 :
            pour_no_btts = item_btts.get_text(' ', strip=True)[:-1]
            print("pourcentage no btts : ",pour_no_btts)
 
        #Déduction de la prediction
        #print("pourcentage btts : ",pour_btts," pourcentage no btts : ",pour_no_btts)
        if pour_btts == 0 or pour_no_btts == 0:
                continue
 
        if str(pour_btts) >= str(pour_no_btts) :
            if pour_btts >= '65' :
                chaine = "btts à "
                flag_btts = 1
                flag_no_btts = 0
                pourc_a_garder = str(pour_btts)
 
        if str(pour_no_btts) >= str(pour_btts) :
            if pour_no_btts >= '80' :
                chaine = "no btts à "
                flag_btts = 0
                flag_no_btts = 1
                pourc_a_garder = str(pour_no_btts)
 
        print ("flag btts : ",flag_btts," flag no btts : ",flag_no_btts)
 
        if flag_btts == 1 or flag_no_btts == 1 :
            ligne = str(recontre)+" ("+str(chaine)+str(pourc_a_garder)+"%)\n"
            print(str(ligne))	
            fichier = codecs.open(nom_fic,"a","utf-8") #on met à jour le fichier
            fichier.write(ligne) #valorisation de la partie BTTS
            fichier.close()
 
    #-------------------------------------#       
    #Partie tableau pair
    #-------------------------------------#
    for item_btts2 in page1.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_0'}).find_all("td"):
        print("item2 : ",item_btts2)
        #print("nb colonne : ",len(item_btts2))
        #print("texte : ",str(item_btts2.getText()))
        #print("nom : ",item_btts2.name, "\n-------")
 
        if len(item_btts2) == 7 :
            #init
            increment = 0
            flag_btts = 0
            flag_no_btts = 0
            pourc_a_garder = 0
            pour_btts = 0
            pour_no_btts = 0
 
            match = item_btts2.find('a')
            if match is None :
                continue
 
            lien_rencontre = match.get("href")
            recontre = match.get_text(' ', strip=True)
            #print("lien : ",lien_rencontre)
            #print("texte lien : ",recontre)
 
        increment = increment + 1
 
        if increment > 3 :
            continue
 
        #print ("inc : ",increment)
 
        #Récupération du pourcentage d'un BTTS
        if increment == 2 :
            pour_btts = item_btts2.get_text(' ', strip=True)[:-1]
            #print("pourcentage btts : ",pour_btts)
 
        #Récupération du pourcentage d'un NO BTTS
        if increment == 3 :
            pour_no_btts = item_btts2.get_text(' ', strip=True)[:-1]
            #print("pourcentage no btts : ",pour_no_btts)
 
        #Déduction de la prediction
        #print("pourcentage btts : ",pour_btts," pourcentage no btts : ",pour_no_btts)
        if pour_btts == 0 or pour_no_btts == 0:
                continue
 
        if str(pour_btts) >= str(pour_no_btts) :
            if pour_btts >= '65' :
                chaine = "btts à "
                flag_btts = 1
                flag_no_btts = 0
                pourc_a_garder = str(pour_btts)
 
        if str(pour_no_btts) >= str(pour_btts) :
            if pour_no_btts >= '80' :
                chaine = "no btts à "
                flag_btts = 0
                flag_no_btts = 1
                pourc_a_garder = str(pour_no_btts)
 
        #print ("flag btts : ",flag_btts," flag no btts : ",flag_no_btts)
 
        if flag_btts == 1 or flag_no_btts == 1 :
            ligne = str(recontre)+" ("+str(chaine)+str(pourc_a_garder)+"%)\n"
            print(str(ligne))
            #fichier = open(nom_fic, "a")	
            fichier = codecs.open(nom_fic,"a","utf-8") #on met à jour le fichier
            fichier.write(ligne) #valorisation de la partie BTTS
            fichier.close()
 
#-------------------------------------#       
#Partie tableau +/- 2,5 buts du fichier
#-------------------------------------#
with urllib.request.urlopen(forebet_url_plus_moins) as f2:
    data2 = f2.read().decode('utf-8')
    page2 = bs4.BeautifulSoup(data2, 'html.parser')
 
    increment = 0
 
    fichier = open(nom_fic, "a")	#on met à jour le fichier
    fichier.write("\n+/- 2,5 buts ( PLUS >= 65% - MOINS >= 80%) \n\n") #init de la partie +/- 2,5 buts
    fichier.close()
 
    #-------------------------------------#       
    #Partie tableau impair
    #-------------------------------------#
    for item_plus_moins in page2.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_0'}).find_all("td"):
        #print("item3 : ",item_plus_moins)
        #print("nb colonne : ",len(item_plus_moins))
        #print("texte : ",str(item_plus_moins.getText()))
        #print("nom : ",item_plus_moins.name, "\n-------")
 
        if len(item_plus_moins) == 7 :
            #init
            increment = 0
            flag_plus = 0
            flag_moins = 0
            pourc_a_garder = 0
            pour_plus = 0
            pour_moins = 0
 
            match = item_plus_moins.find('a')
            if match is None :
                continue
 
            lien_rencontre = match.get("href")
            recontre = match.get_text(' ', strip=True)
            #print("lien : ",lien_rencontre)
            #print("texte lien : ",recontre)
 
        increment = increment + 1
 
        if increment > 3 :
            continue
 
        #print ("inc : ",increment)
 
        #Récupération du pourcentage de + 2,5 buts
        if increment == 2 :
            pour_plus = item_plus_moins.get_text(' ', strip=True)[:-1]
            #print("pourcentage plus : ",pour_plus)
 
        #Récupération du pourcentage de - 2,5 buts
        if increment == 3 :
            pour_moins = item_plus_moins.get_text(' ', strip=True)[:-1]
            #print("pourcentage moins : ",pour_moins)
 
        #Déduction de la prediction
        #print("pourcentage plus : ",pour_plus," pourcentage moins : ",pour_moins)
        if pour_plus == 0 or pour_moins == 0:
                continue
 
        if str(pour_plus) >= str(pour_moins) :
            if pour_plus >= '65' :
                chaine = "plus à "
                flag_plus = 1
                flag_moins = 0
                pourc_a_garder = str(pour_plus)
 
        if str(pour_moins) >= str(pour_plus) :
            if pour_moins >= '80' :
                chaine = "moins à "
                flag_plus = 0
                flag_moins = 1
                pourc_a_garder = str(pour_moins)
 
        #print ("flag plus : ",flag_plus," flag moins : ",flag_moins)
 
        if flag_plus == 1 or flag_moins == 1 :
            ligne = str(recontre)+" ("+str(chaine)+str(pourc_a_garder)+"%)\n"
            print(str(ligne))
            #fichier = open(nom_fic, "a")	
            fichier = codecs.open(nom_fic,"a","utf-8") #on met à jour le fichier
            fichier.write(ligne) #valorisation de la partie BTTS
            fichier.close()
 
    #-------------------------------------#       
    #Partie tableau pair
    #-------------------------------------#
    for item_plus_moins2 in page2.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_0'}).find_all("td"):
        #print("item4 : ",item_plus_moins2)
        #print("nb colonne : ",len(item_plus_moins2))
        #print("texte : ",str(item_plus_moins2.getText()))
        #print("nom : ",item_plus_moins2.name, "\n-------")
 
        if len(item_plus_moins2) == 7 :
            #init
            increment = 0
            flag_plus = 0
            flag_moins = 0
            pourc_a_garder = 0
            pour_plus = 0
            pour_moins = 0
 
            match = item_plus_moins2.find('a')
            if match is None :
                continue
 
            lien_rencontre = match.get("href")
            recontre = match.get_text(' ', strip=True)
            #print("lien : ",lien_rencontre)
            #print("texte lien : ",recontre)
 
        increment = increment + 1
 
        if increment > 3 :
            continue
 
        #print ("inc : ",increment)
 
        #Récupération du pourcentage de + 2,5 buts
        if increment == 2 :
            pour_plus = item_plus_moins2.get_text(' ', strip=True)[:-1]
            #print("pourcentage plus : ",pour_plus)
 
        #Récupération du pourcentage de - 2,5 buts
        if increment == 3 :
            pour_moins = item_plus_moins2.get_text(' ', strip=True)[:-1]
            #print("pourcentage moins : ",pour_moins)
 
        #Déduction de la prediction
        #print("pourcentage plus : ",pour_plus," pourcentage moins : ",pour_moins)
        if pour_plus == 0 or pour_moins == 0:
                continue
 
        if str(pour_plus) >= str(pour_moins) :
            if pour_plus >= '65' :
                chaine = "plus à "
                flag_plus = 1
                flag_moins = 0
                pourc_a_garder = str(pour_plus)
 
        if str(pour_moins) >= str(pour_plus) :
            if pour_moins >= '80' :
                chaine = "moins à "
                flag_plus = 0
                flag_moins = 1
                pourc_a_garder = str(pour_moins)
 
        #print ("flag plus : ",flag_plus," flag moins : ",flag_moins)
 
        if flag_plus == 1 or flag_moins == 1 :
            ligne = str(recontre)+" ("+str(chaine)+str(pourc_a_garder)+"%)\n"
            print(str(ligne))
            #fichier = open(nom_fic, "a")	
            fichier = codecs.open(nom_fic,"a","utf-8") #on met à jour le fichier
            fichier.write(ligne) #valorisation de la partie BTTS
            fichier.close()

**wiztricks** · 29/04/2017, 20h58

Salut,

Envoyé par drogba72

Les données de la seconde page ne sont pas toutes interprétées ... On dirait que seule la première ligne du tableau est récupérée.
Auriez vous une piste à me fournir svp ?

Votre soucis n'est pas dans le code ou dans l'utilisation de BeautifulSoup mais dans les éléments HTML sur lesquels se caler pour récupérer les informations souhaitées.
Quand je dois galérer avec une page HTML, j'en récupère une copie en local, je l'ouvre avec Firefox et je lance l'inspector qui permet de voir la disposition de la page. D'un autre côté, je lance l'interpréteur Python, je charge le fichier HTML dans BS et je regarde le résultat des sélections qui font sens et j'ajuste...

- W

**drogba72** · 01/05/2017, 17h14

Bonjour,

Merci tout d'abord pour votre réponse.
Toutefois, je me permet de dire qu'elle ne m'a beaucoup avancé ou alors je n'ai pas compris ce que vous avez voulu mettre en avant.
Je n'avais pas pensé à enregistrer la page en local. Néanmoins, j'utilise l'inspecteur directement sur la page hébergé, ce qui me permet de faire des tests et voir si le code fonctionne.
Ma méconnaissance du langage fait qu'effectivement je pense avoir un problème avec bs4 mais il s'agit peut être d'autre chose.
Ce que j'observe c'est qu'à l'appel du second with, le code ne se comporte plus de la même manière et je ne trouve rien sur cette observation sur le net.
Avez vous connaissance d ece genre de problème ?

Avez vous essayer le code que j'ai laissé sur mon premier post ? Si oui, vous verrezz tout de suite l'anomalie.

Cordialement.

**wiztricks** · 01/05/2017, 17h46

Envoyé par drogba72

Ce que j'observe c'est qu'à l'appel du second with, le code ne se comporte plus de la même manière et je ne trouve rien sur cette observation sur le net.
Avez vous connaissance d ece genre de problème ?

Avez vous essayer le code que j'ai laissé sur mon premier post ? Si oui, vous verrezz tout de suite l'anomalie.

Désolé mais vous avez posté 500 lignes de code, pas le temps d'essayer de comprendre ce que vous avez essayé de faire, ni dans votre tête pour savoir si ce que vous obtenez est attendu. A vous de réduire et d'exposer le problème en quelques lignes (c'est en général comme çà que vous allez trouver sinon l'erreur au moins quelques mots clefs avec lesquels faire des recherches).

- W

**drogba72** · 01/05/2017, 18h18

Encore merci pour votre temps

Je viens d'appliquer vos derniers conseils et effectivement vous aviez certainement raison depuis le départ !!!
Le problème ne vient pas du code mais de l'interprétation de la page HTML !! Par contre, je ne comprends pas d'où vient cette mauvaise interprétation ...

En fait, lorsque j'effectue un l'instruction print(page1.find('table', {'class' : 'schema'})), cela m'affiche le tableau avec son entête et seulement le premier match (Alianza Petrolera vs Cortuluá).

J'ai réduit le code comme vous m'avez demandé à la partie ci-dessous car la boucle sera certainement la solution

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
forebet_url_btts = 'https://www.forebet.com/fr/previsions-de-football-pour-demain/chaque-equipe-marque'
 
with urllib.request.urlopen(forebet_url_btts) as f1:
    data1 = f1.read().decode('utf-8')
    page1 = bs4.BeautifulSoup(data1, 'html.parser')
 
    increment = 0
 
    print(page1.find('table', {'class' : 'schema'}))
 
    for item_btts in page1.find('table', {'class' : 'schema'}).find('tr', {'class' : 'tr_0'}).find_all("td"):
        print("item1 : ",item_btts)

**wiztricks** · 01/05/2017, 18h40

Envoyé par drogba72

Je viens d'appliquer vos derniers conseils et effectivement vous aviez certainement raison depuis le départ !!!
Le problème ne vient pas du code mais de l'interprétation de la page HTML !! Par contre, je ne comprends pas d'où vient cette mauvaise interprétation ...

Et ouais, c'est là que le boulot ch.... commence (et que je botte en touche en disant qu'à priori Python n'est pas concerné

ce qui ne vous aide pas, je sais...).

- W

**drogba72** · 01/05/2017, 18h58

Merci encore en espérant qu'un autre bon samaritain me donne un indice pour avancer

Par contre, comment peut-on dire que python n'est pas concerné ?

**wiztricks** · 01/05/2017, 21h05

Envoyé par drogba72

Par contre, comment peut-on dire que python n'est pas concerné ?

Le fait est que les informations sont dans la page... mais on ne sait pas comment les adresser pour les récupérer facilement.... Et le temps que j'ai pu mettre pour arriver à trouver un adressage raisonnable pour certaines pages lorsque je me suis collé à cet exercice: c'est pas parce que c'est "compliqué" et "surprenant" que c'est la faute à Python ou à BS.
Je suppose que ceux qui s'y adonnent régulièrement ont des outils qui permettant de trouver plus facilement (et c'est une question à poser dans un forum de la rubrique Web).

- W

Aide beautifulsoup néofite

Python

Discussions similaires

Partager

Partager