IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Python 3 Recuperer HTML page web


Sujet :

Python

  1. #1
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2016
    Messages
    21
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2016
    Messages : 21
    Points : 8
    Points
    8
    Par défaut Python 3 Recuperer HTML page web
    Bonjour, je souhaite faire un programme simple afin de récuperer le code HTML d'une page web .
    voici mon code :

    stock=urllib.request.urlopen("site")
    print(stock.read())

    Ce pendant lorsque j’exécute ce dernier je reçois une error 403 HTTP

    "File "/Users/utilisateur/PycharmProjects/adidasscan/adidasscan.py", line 9, in <module>
    stock=urllib.request.urlopen("site")
    File "/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/urllib/request.py", line 156, in urlopen
    return opener.open(url, data, timeout)
    File "/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/urllib/request.py", line 475, in open
    response = meth(req, response)
    File "/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/urllib/request.py", line 587, in http_response
    'http', request, response, code, msg, hdrs)
    File "/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/urllib/request.py", line 513, in error
    return self._call_chain(*args)
    File "/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/urllib/request.py", line 447, in _call_chain
    result = func(*args)
    File "/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/urllib/request.py", line 595, in http_error_default
    raise HTTPError(req.full_url, code, msg, hdrs, fp)
    urllib.error.HTTPError: HTTP Error 403: Forbidden "


    Que faire ? merci de votre aide

  2. #2
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 287
    Points : 36 776
    Points
    36 776
    Par défaut
    Salut,
    Le message d'erreur est pourtant clair:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    urllib.error.HTTPError: HTTP Error 403: Forbidden "
    Si vous pouvez accéder à ces pages avec votre navigateur, le faire avec un programme, c'est reproduire les mêmes étapes.
    Vous seul les connaissez.
    Vous vous êtes aussi renseigné pour savoir si le site n'offrait pas une API "programmatique' - plus facile à utiliser que celle qu'utilise votre navigateur.
    En tout cas, tant qu'on ne sait pas "quoi" programmer, on ne peut pas programmer.

    -W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2016
    Messages
    21
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2016
    Messages : 21
    Points : 8
    Points
    8
    Par défaut
    Avec mon navigateur j'arrive a accéder a ces pages et le htlm . je veux juste recuperer le code HTML a l'aide de python afin de voir si il y a du changement sur la page de facon automatique .

    les lignes de code que j'ai mis ne sont qu'une partie du code . Ma question est donc comment eviter d'avoir une erreur 403 interdit quand je recupère la code HTML de cette page

  4. #4
    Expert éminent Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 035
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 035
    Points : 8 400
    Points
    8 400
    Par défaut
    salut,

    c'est surement un problème de user-agent, le serveur en face reconnait le user-agent par défaut de python et l'interdit
    suffirait donc de le changer pour que ça passe, à tester

  5. #5
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2016
    Messages
    21
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2016
    Messages : 21
    Points : 8
    Points
    8
    Par défaut
    salut, je viens d'importer urllib.request as M et toujours pareil :/

  6. #6
    Expert éminent

    Homme Profil pro
    Inscrit en
    Octobre 2008
    Messages
    4 300
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Octobre 2008
    Messages : 4 300
    Points : 6 780
    Points
    6 780
    Par défaut
    Salut,

    Ben oui, mais la réponse de BufferBob est toujours pareille aussi.

Discussions similaires

  1. [libcurl] Recuperer une page web
    Par Evrard06 dans le forum Bibliothèques
    Réponses: 3
    Dernier message: 25/09/2009, 23h29
  2. Récupérer code html page web
    Par saturn1 dans le forum Général Java
    Réponses: 12
    Dernier message: 13/07/2009, 19h26
  3. recuperer une page web
    Par openWorld dans le forum Langage
    Réponses: 5
    Dernier message: 19/05/2007, 11h11
  4. recuperer une page web
    Par Liiscar dans le forum Documents
    Réponses: 1
    Dernier message: 10/01/2007, 18h29
  5. Recuperer une page Web sous Windows
    Par tmanta7 dans le forum Réseau
    Réponses: 7
    Dernier message: 22/05/2006, 23h21

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo