Bonjour,
Avant tout je précise que ça fais 2 jours que je me suis mis au Python.
Ce que j'essaie de faire c'est de me connecter à un site web, et de récupérer des informations qui sont dans un tableau. Je procède par étapes et tout d'abord, j'ai réussi à télécharger la page html, puis j'ai tronqué la page pour garder en gros la partie dont j'ai besoin.
Je n'ai pas encore réussi à avoir que ce dont j'ai besoin.
Problème c'est que je développe parfois au boulot (je sais c'est mal), donc je passe par un proxy, c'est là que le problème se pose. Quand je lance le script, il me retourne -1.
Pouvez vous m'aider s'il vous plait, pas forcément avec les réponses mais des pistes. Je poste le code.
Merci
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17 #!/usr/bin/python import urllib proxies = {'http': 'http://1XX.1X.X.2XX:8000'} page = urllib.urlopen('http://uoif-online.com/v3/spip.php?article571', proxies=proxies) pageHtml = page.read() position = pageHtml.find("<div id=\"horaires\">") #recupere la position de la chaine pageHtml2 = pageHtml[position:] fichier = open("page.html","w") fichier.write(pageHtml2) fichier.close()
Partager