[Python 3.X] Recuperer tout le contenu d'une balise dans fichier html

Salut, bon voilà mon problème, je chercher a recuperer tous les contenus de la balise <td> dans un fichier html. je crois être dans la bon direction...
sa marche bien sur, mais certain <td> son ignorer.
et les contenues de cet site que j'aimerais recuperer.
voici le code

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
import requests
import sys, sqlite3
import os, time
 
x =requests.get('http://sslproxies.org')
files ="source.txt"
open(files,"w").write(x.text)
 
name_ =time.strftime("%A_%Y_%H:%M")
 
dbname ="ips/{}".format(name_)
conn =sqlite3.connect(dbname)
cur =conn.cursor()
 
 
 
print(name_)
try:
    cur.execute("CREATE TABLE IP('{}' TEXT)".format(name_))
except:
    pass
 
obj_fichier = open('source.txt', 'r')
begin_balise = '<td>'
end_balise = '</td>'
while True:
    ligne = obj_fichier.readline()
    pos_begin = ligne.find(begin_balise)
    pos_end = ligne.find(end_balise)
    if pos_begin != -1:
        l = len(begin_balise)
        extract = ligne[pos_begin + l:pos_end]
        print(extract)
        cur.execute("INSERT INTO IP('{}') VALUES('{}')".format(name_, extract))
        conn.commit
 
obj_fichier.close()

svp

Recuperer tout le contenu d'une balise dans fichier html

Python

Mode arborescent

Discussions similaires

Partager

Partager