Extraire des données d'un fichier html
Bonjour,
Je suis grand débutant en python et je cherche à extraire des données d'une page html.
Je me suis dirigé vers urllib2, peut-être à tord...
Je souhaite extraire ces données et les réutiliser ensuite pour les insérer dans un fichier .tex.
Il faut donc que je les stocke.
Après 48h de recherche, je suis revenu au point de départ avec un code qui ne marche pas, je ne comprends pas pourquoi. Le voici :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
| #!/usr/bin/python
# -*- coding: utf-8 -*-
#avec python2.7 pour urllib
import urllib2
u = urllib2.urlopen("http://www.meteociel.fr/observations-meteo/temps-reel.php")
fich = u.read()
u.close()
f = open("data1.txt","w")
f.write(fich)
f.close()
import sys, re
# on sélectionne le texte entre les balises
rec_cont=re.compile('<meta name="keywords".*?français">',re.M|re.S)
with open("data1.txt",'r') as f : #ouverture du fichier data1
lignes=f.read()
n=0
for k in rec_cont.findall(lignes) :
n+=1
with open("data2.txt", 'w') as g:
g = open("data2.txt", 'w')
contenu=str(rec_cont.findall(ligs))
g.write(contenu)
g.close() |
je souhaite donc réutiliser les données de contenu dans un deuxième temps, ce que je n'arrive pas à faire.
La cerise sur le gâteau, c'est que le fichier data1.txt est bien créé mais pas data2.txt !
Si quelqu'un peut me donner des idées (simples car j'essaie de m'y mettre)...