Bonjour,
Je suis grand débutant en python et je cherche à extraire des données d'une page html.
Je me suis dirigé vers urllib2, peut-être à tord...
Je souhaite extraire ces données et les réutiliser ensuite pour les insérer dans un fichier .tex.
Il faut donc que je les stocke.
Après 48h de recherche, je suis revenu au point de départ avec un code qui ne marche pas, je ne comprends pas pourquoi. Le voici :
je souhaite donc réutiliser les données de contenu dans un deuxième temps, ce que je n'arrive pas à faire.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28 #!/usr/bin/python # -*- coding: utf-8 -*- #avec python2.7 pour urllib import urllib2 u = urllib2.urlopen("http://www.meteociel.fr/observations-meteo/temps-reel.php") fich = u.read() u.close() f = open("data1.txt","w") f.write(fich) f.close() import sys, re # on sélectionne le texte entre les balises rec_cont=re.compile('<meta name="keywords".*?français">',re.M|re.S) with open("data1.txt",'r') as f : #ouverture du fichier data1 lignes=f.read() n=0 for k in rec_cont.findall(lignes) : n+=1 with open("data2.txt", 'w') as g: g = open("data2.txt", 'w') contenu=str(rec_cont.findall(ligs)) g.write(contenu) g.close()
La cerise sur le gâteau, c'est que le fichier data1.txt est bien créé mais pas data2.txt !
Si quelqu'un peut me donner des idées (simples car j'essaie de m'y mettre)...
Partager