Python 3 Recuperer HTML page web

**YZYAZ** · 12/06/2016, 21h01

Bonjour, je souhaite faire un programme simple afin de récuperer le code HTML d'une page web .
voici mon code :

stock=urllib.request.urlopen("site")
print(stock.read())

Ce pendant lorsque j’exécute ce dernier je reçois une error 403 HTTP

"File "/Users/utilisateur/PycharmProjects/adidasscan/adidasscan.py", line 9, in <module>
stock=urllib.request.urlopen("site")
File "/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/urllib/request.py", line 156, in urlopen
return opener.open(url, data, timeout)
File "/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/urllib/request.py", line 475, in open
response = meth(req, response)
File "/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/urllib/request.py", line 587, in http_response
'http', request, response, code, msg, hdrs)
File "/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/urllib/request.py", line 513, in error
return self._call_chain(*args)
File "/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/urllib/request.py", line 447, in _call_chain
result = func(*args)
File "/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/urllib/request.py", line 595, in http_error_default
raise HTTPError(req.full_url, code, msg, hdrs, fp)
urllib.error.HTTPError: HTTP Error 403: Forbidden "

Que faire ? merci de votre aide

**wiztricks** · 12/06/2016, 21h39

Salut,
Le message d'erreur est pourtant clair:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

urllib.error.HTTPError: HTTP Error 403: Forbidden "

Si vous pouvez accéder à ces pages avec votre navigateur, le faire avec un programme, c'est reproduire les mêmes étapes.
Vous seul les connaissez.
Vous vous êtes aussi renseigné pour savoir si le site n'offrait pas une API "programmatique' - plus facile à utiliser que celle qu'utilise votre navigateur.
En tout cas, tant qu'on ne sait pas "quoi" programmer, on ne peut pas programmer.

-W

**YZYAZ** · 12/06/2016, 21h59

Avec mon navigateur j'arrive a accéder a ces pages et le htlm . je veux juste recuperer le code HTML a l'aide de python afin de voir si il y a du changement sur la page de facon automatique .

les lignes de code que j'ai mis ne sont qu'une partie du code . Ma question est donc comment eviter d'avoir une erreur 403 interdit quand je recupère la code HTML de cette page

**BufferBob** · 13/06/2016, 07h33

salut,

c'est surement un problème de user-agent, le serveur en face reconnait le user-agent par défaut de python et l'interdit
suffirait donc de le changer pour que ça passe, à tester