IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Réseau/Web Python Discussion :

[QST] Parser un fichier HTML


Sujet :

Réseau/Web Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2009
    Messages
    389
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2009
    Messages : 389
    Par défaut [QST] Parser un fichier HTML
    Bonjour a tous,

    je suis en train d'apprendre le python, et pour me former je cherche a faire un script qui recupere la première image de google Images.

    J'ai définie que celle-ci est contenue dans le premier element li qui a pour classe 'rg_li' et qui est contenue dans la div d'id 'rg_s'.

    Donc pour faire ceci je forme une url pour google images, je vais cherché la page et je la recupere en texte. Mon probleme est que je n'arrive pas a la savoir comment faire pour parser ceci en XML (ou HTML) afin de pouvoir naviguer en son sein sans soucis.

    voici mon code pour l'instant
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
     
    import http.client as httplib
     
    def getImg(rechercheGoogle):
        # rechercheGoogle est de la forme
        #"/search?tbm=isch&hl=fr&source=hp&q=mon+image+a+chercher&biw=1280&bih=899"
        connexionGoogle = httplib.HTTPConnection("www.google.fr")
        connexionGoogle.request("GET", rechercheGoogle)
     
        page = connexionGoogle.getresponse()
     
        #ici j'ai bien la page sous forme de string
        print(page.read())
     
        # traitement a faire pour la recherche de l'image
     
        connexionGoogle.close()
    Donc savez-vous comment faire pour naviguer facilement au sein du dom de la page HTML ?

    Je vous remercie d'avance pour votre aide

  2. #2
    Membre éclairé
    Profil pro
    maçon
    Inscrit en
    Novembre 2004
    Messages
    286
    Détails du profil
    Informations personnelles :
    Localisation : France, Haute Loire (Auvergne)

    Informations professionnelles :
    Activité : maçon

    Informations forums :
    Inscription : Novembre 2004
    Messages : 286
    Par défaut
    bonsoir,
    Pour ma part j'utilise les expressions régulières (regex)
    Ou bien vous pouvez aussi vous appuyer sur le module beautifulsoup
    dont voici le lien :http://www.crummy.com/software/BeautifulSoup/
    espérant vous avoir aidé

  3. #3
    Membre éclairé
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2009
    Messages
    389
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2009
    Messages : 389
    Par défaut
    Merci, BeautifoulSoup ne fonctionne pas sous python 3.....

    j'ai reussi grace a une regex
    Merci

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. parser un fichier HTML avec JAVA
    Par ouinih dans le forum EDI et Outils pour Java
    Réponses: 2
    Dernier message: 09/02/2009, 10h33
  2. parser un fichier html: htmlparser
    Par dalila555 dans le forum Format d'échange (XML, JSON...)
    Réponses: 4
    Dernier message: 24/04/2007, 11h34
  3. parser un fichier html en utilisant java
    Par taouja dans le forum Services Web
    Réponses: 1
    Dernier message: 16/04/2007, 10h12
  4. [C#] Comment lire et parser un fichier html ?
    Par fix105 dans le forum C#
    Réponses: 4
    Dernier message: 28/01/2006, 15h38
  5. parser un fichier html
    Par noarno dans le forum ASP
    Réponses: 2
    Dernier message: 10/12/2003, 17h53

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo