Bonjour,
J'aimerais lire le code source d'une page internet pour ensuite y récupérer des données. Cette page est protégée par un mot de passe.
J'ai trouvé un petit script qui permet cela mais il ne marche pas. Quand je le lance il m'affiche le code source de la page qui permet de se connecter.
Quelqu'un pourrait m'aider? Merci d'avance
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 import urllib2 prog_URL = urllib2.HTTPPasswordMgrWithDefaultRealm( ) prog_URL.add_password(None, 'http://www.monsite.fr/login', 'id', 'motdepasse') # Authentification auth = urllib2.HTTPBasicAuthHandler(prog_URL) opener = urllib2.build_opener(auth) urllib2.install_opener(opener) flob = urllib2.urlopen('http://www.monsite.fr/lapagequicontientlesinformations.html) # Afficher le fichier for line in flob.readlines( ): print line,
Partager