IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Réseau/Web Python Discussion :

besoin aide - parser HTML - BeautifulSoup


Sujet :

Réseau/Web Python

  1. #1
    Futur Membre du Club
    Inscrit en
    Avril 2007
    Messages
    8
    Détails du profil
    Informations forums :
    Inscription : Avril 2007
    Messages : 8
    Points : 8
    Points
    8
    Par défaut besoin aide - parser HTML - BeautifulSoup
    Bonjour,

    Je ne saisis pas tout dans la doc de BeautifulSoup...

    Je cherche à récupérer une page HTML, qui comporte dedans un texte "New Wallpapers Update :" suivi ensuite d'une date...
    Mon but est de récupérer cette date, qui change évidemment de temps en temps...

    J'ai pour l'instant fait ça:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
     
    import BeautifulSoup
    import urllib
    import re
     
    myUrl="http://www.desktopgirls.com/intro.htm"
    myPage=urllib.urlopen(myUrl)
    myPageBuffer=myPage.read()
     
    mySoup=BeautifulSoup.BeautifulSoup(myPageBuffer)
     
    comment=mySoup.find(text=re.compile("Wallpapers Update"))
    print comment
     
    myPage.close()
    Je récupère bien la mention "Wallpapers Update" ... Par contre, je n'ai aucune idée de comment je pourrais récupérer la suite ?

    Merci d'avance, je sèche depuis plusieurs jours... :-/

  2. #2
    Futur Membre du Club
    Profil pro
    Inscrit en
    Octobre 2006
    Messages
    6
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2006
    Messages : 6
    Points : 7
    Points
    7
    Par défaut
    Il suffit de regarder dans le DOM (sous firefox dans outil) quel est le tag qui entoure le texte recherché et ensuite de chercher le tag approprié
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
     
    import BeautifulSoup
    import urllib
     
    myUrl="http://www.desktopgirls.com/intro.htm"
    myPage=urllib.urlopen(myUrl)
    myPageBuffer=myPage.read()
     
    mySoup=BeautifulSoup.BeautifulSoup(myPageBuffer)
     
    all_font=mySoup.findAll(color="#DF8F00")
     
     
    for font_en_cours in all_font :
        if font_en_cours.string <> None :
            print font_en_cours.string
    myPage.close()

  3. #3
    Futur Membre du Club
    Inscrit en
    Avril 2007
    Messages
    8
    Détails du profil
    Informations forums :
    Inscription : Avril 2007
    Messages : 8
    Points : 8
    Points
    8
    Par défaut
    Merci beaucoup Hélix ! :-)

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Débutant] Besoin d'aide en HTML/CSS
    Par youness78 dans le forum NHibernate
    Réponses: 1
    Dernier message: 29/07/2014, 16h46
  2. [HTML] Besoin d'aide en HTML
    Par fabris dans le forum Balisage (X)HTML et validation W3C
    Réponses: 17
    Dernier message: 08/08/2006, 16h34
  3. [HTML] Besoin aide sur scroll et balise
    Par Kerod dans le forum Balisage (X)HTML et validation W3C
    Réponses: 6
    Dernier message: 24/03/2005, 14h42
  4. débutant : besoin aide
    Par simon76 dans le forum Flash
    Réponses: 6
    Dernier message: 14/08/2003, 16h03

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo