IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Réseau/Web Python Discussion :

BeautifulSoup et HTML ma formé


Sujet :

Réseau/Web Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Nouveau candidat au Club
    Profil pro
    Inscrit en
    Février 2009
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2009
    Messages : 2
    Par défaut BeautifulSoup et HTML ma formé
    Salut

    J'utilise BeautifulSoup pour crawler des pages et en resortir des infos.
    Ca marche tres bien uniquement lorsque la page est bien formé, pas d'erreur.

    Dès qu'une erreur apparait du genre : <a href=test">test</a> ca casse

    Quelqu'un aurait une idée ?

  2. #2
    Membre Expert
    Avatar de DelphiManiac
    Homme Profil pro
    Homme à tout faire
    Inscrit en
    Mars 2002
    Messages
    1 147
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Homme à tout faire
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mars 2002
    Messages : 1 147
    Par défaut
    Salut,

    Faire un coup de tidy si tu trouves une erreur et relancer ton parse après.

    http://utidylib.berlios.de/

  3. #3
    Nouveau candidat au Club
    Profil pro
    Inscrit en
    Février 2009
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2009
    Messages : 2
    Par défaut
    Je n'arrive pas a me servir de utidy, deja je n'arrive pas a l'installer.

  4. #4
    Membre Expert
    Avatar de DelphiManiac
    Homme Profil pro
    Homme à tout faire
    Inscrit en
    Mars 2002
    Messages
    1 147
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Homme à tout faire
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mars 2002
    Messages : 1 147
    Par défaut
    Fais une recherche sur google avec comme mots clés : python tidy, ils y a plusieurs bibliothèques, utidylib est un peu vieux. Par contre il te faut sûrement installé aussi tidy, http://tidy.sourceforge.net/ vu que ces packages sont à priori des wrappers vers tidy.

Discussions similaires

  1. [html, balise form] comment composer une url sans le "?"
    Par Invité dans le forum Balisage (X)HTML et validation W3C
    Réponses: 7
    Dernier message: 29/01/2007, 03h50
  2. [HTML]Newsletter forme et fond
    Par Chronax dans le forum Balisage (X)HTML et validation W3C
    Réponses: 2
    Dernier message: 13/06/2006, 12h57
  3. [HTML]Prob: <FORM>, retour à la ligne automatique
    Par markeno dans le forum Balisage (X)HTML et validation W3C
    Réponses: 1
    Dernier message: 31/05/2006, 04h18
  4. [Forms 5] Ouvrir un HTML depuis forms
    Par anthony8 dans le forum Forms
    Réponses: 2
    Dernier message: 28/06/2005, 14h45
  5. [Forms9i]Ouvrir une page HTML depuis forms
    Par benjamin50 dans le forum Forms
    Réponses: 13
    Dernier message: 17/03/2005, 16h54

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo