IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Zope Python Discussion :

Expression Réguliére: récupérer une partie de lien html


Sujet :

Zope Python

  1. #1
    Candidat au Club
    Profil pro
    Inscrit en
    Novembre 2007
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2007
    Messages : 2
    Points : 2
    Points
    2
    Par défaut Expression Réguliére: récupérer une partie de lien html
    Bonjour à tous.

    Je viens vous embetter, car je n'arrive pas à trouver de solution pour une expression régulière, toute aide serait la bienvenue.

    Je dois récupérer un mot d'un lien html, et le probléme est que je ne vois pas comment utiliser la négation pour que ca marche.

    Exemple de lien: <a href="http://fr.wikipedia.org/wiki/Crawler" link="blabla" ... >

    Ce que je veux recuperer: Crawler

    Mon expression régulière:
    lienRegExp = re.compile('<a href=["\']http://fr.wikipedia.org/wiki/(.*?)["\']>', re.IGNORECASE)


    #On stocke toutes les url dans la liste des urls non crawlees

    for url in lienRegExp.findall(source_html):

    urlsNonCrawles.append(url)
    print url

    Ce qu'il me sort: Crawler" class="link

    Mon probléme: il me faudrait une négation je pense, comme: [^\"], mais je ne sais pas comment faire... et je ne trouve rien sur votre site (ou sinon, je comprend pas).

    Si quelqu'un a une solution, je suis preneur. Merci

  2. #2
    Candidat au Club
    Profil pro
    Inscrit en
    Novembre 2007
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2007
    Messages : 2
    Points : 2
    Points
    2
    Par défaut
    C'est bon, j'ai trouvé, la solution est dans chilkat.

    Suffit d'aller sur la page, c'est un module crawler pour python. Voilou.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 4
    Dernier message: 09/11/2012, 14h15
  2. [AJAX] Récupérer une partie d'une page HTML
    Par mcdelay dans le forum AJAX
    Réponses: 3
    Dernier message: 17/07/2012, 17h31
  3. Expression régulière lié à une balise html
    Par chris_013 dans le forum JSF
    Réponses: 3
    Dernier message: 28/05/2009, 14h34
  4. [HTML] Masquer une partie de lien en html
    Par marcapys dans le forum Balisage (X)HTML et validation W3C
    Réponses: 4
    Dernier message: 21/03/2008, 08h04
  5. [DOM] Récupérer une partie d’un fichier HTML
    Par fadex dans le forum Bibliothèques et frameworks
    Réponses: 4
    Dernier message: 05/01/2007, 12h30

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo