IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

beautiful soup get content


Sujet :

Python

  1. #1
    Membre averti
    Homme Profil pro
    SEO
    Inscrit en
    Mai 2014
    Messages
    19
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : SEO
    Secteur : Biens de consommation

    Informations forums :
    Inscription : Mai 2014
    Messages : 19
    Par défaut beautiful soup get content
    Bonjour,

    J'essaie de récupérer le le contenu de toutes les balises <p> d'une page web.

    J'ai écrit le code suivant :

    import urllib2
    from bs4 import BeautifulSoup

    page = urllib2.urlopen('http://www.escalier-escamotable.net').read()
    soup = BeautifulSoup(page)
    contenu = soup.findAll('p',text=True)

    for content in contenu:
    print(soup.find('p').getText())

    Le problème c'est que çà ne récupère que le premier paragraphe en boucle. Je ne comprend pas pourquoi vous avez pas une piste ?

  2. #2
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 697
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 697
    Par défaut
    Salut,
    N'oubliez pas la balise code!

    Que fait soup.find('p')? Pourquoi faire soup.find('p') alors que ce qui vous intéresse est "contenu"?

    Ce que vous vouliez écrire est une chose comme:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    contenu = soup.findAll('p',text=True)
     
    for e in contenu:
    	print(e.text)
    Fatigue? Erreur de logique? Vous vous laissez impressionnez par le monstre?
    Encore des coups comme çà et on va vous expliquer gentiment l'intérêt d'un tuto comme le Swinnen...

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

Discussions similaires

  1. function. file-get-contents error
    Par voyageurdumonde dans le forum Langage
    Réponses: 6
    Dernier message: 15/03/2016, 10h55
  2. [PowerShell] get-content peux désormais traiter les fichiers XML
    Par I'm_HERE dans le forum Scripts/Batch
    Réponses: 0
    Dernier message: 27/11/2011, 21h05
  3. [MySQL] Warning: file_get_contents() [function.file-get-contents]
    Par django29 dans le forum PHP & Base de données
    Réponses: 1
    Dernier message: 15/06/2011, 15h12
  4. file get content qui ne fonctionne plus
    Par rollergirl dans le forum Langage
    Réponses: 4
    Dernier message: 02/09/2010, 14h30
  5. erreur sur file-get-contents
    Par Vil'Coyote dans le forum Apache
    Réponses: 3
    Dernier message: 06/11/2009, 11h54

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo