Garder un morceau d'une page web

Bonjour,

Avant tout je précise que ça fais 2 jours que je me suis mis au Python.
Ce que j'essaie de faire c'est de me connecter à un site web, et de récupérer des informations qui sont dans un tableau. Je procède par étapes et tout d'abord, j'ai réussi à télécharger la page html, puis j'ai tronqué la page pour garder en gros la partie dont j'ai besoin.

Je n'ai pas encore réussi à avoir que ce dont j'ai besoin.

Problème c'est que je développe parfois au boulot (je sais c'est mal), donc je passe par un proxy, c'est là que le problème se pose. Quand je lance le script, il me retourne -1.

Pouvez vous m'aider s'il vous plait, pas forcément avec les réponses mais des pistes. Je poste le code.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
 
#!/usr/bin/python
 
import urllib
 
proxies = {'http': 'http://1XX.1X.X.2XX:8000'}
 
page = urllib.urlopen('http://uoif-online.com/v3/spip.php?article571', proxies=proxies)
pageHtml = page.read()
 
position = pageHtml.find("<div id=\"horaires\">") #recupere la position de la chaine
 
pageHtml2 = pageHtml[position:]
 
fichier = open("page.html","w")
fichier.write(pageHtml2)
fichier.close()

Merci

Garder un morceau d'une page web

Python

Mode arborescent

Discussions similaires

Partager

Partager