IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Web Perl Discussion :

[web] Recherche et récupération du motif <img src.... > ds f


Sujet :

Web Perl

  1. #1
    LFC
    LFC est déconnecté
    Membre régulier
    Profil pro
    Inscrit en
    Février 2003
    Messages
    106
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2003
    Messages : 106
    Points : 70
    Points
    70
    Par défaut [web] Recherche et récupération du motif <img src.... > ds f
    Bonjour

    Je souhaite créer un script qui va me permettre de checker dans une grosse liste de fichiers html les balises images et vérifier qu'elles ont l'attribut "alt".

    Pour cela, je souhaite à la fin obtenir un fichier txt où j'aurai 1 ligne composée de 2 champs :
    NOM DU FICHIER - Balise <img src....>

    Le motif que je recherche à collecter est donc "<img src" puis tout le reste jusqu'au caractère >, et c'est là le hic, je ne sais pas comment écrire le code pour dire :
    "dès que tu trouves le motif "<img src", tu récupères depuis la balise "<" jusqu'à la balise ">".

    Qui peut m'aider ?


    Merci.

  2. #2
    Expert éminent
    Avatar de Jedai
    Homme Profil pro
    Enseignant
    Inscrit en
    Avril 2003
    Messages
    6 245
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : Enseignant

    Informations forums :
    Inscription : Avril 2003
    Messages : 6 245
    Points : 8 586
    Points
    8 586
    Par défaut
    Tu peux utiliser une regex comme ça :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    m/<(img src[^>]+)>/i


    --
    Jedaï

  3. #3
    Membre du Club
    Inscrit en
    Août 2004
    Messages
    50
    Détails du profil
    Informations forums :
    Inscription : Août 2004
    Messages : 50
    Points : 60
    Points
    60
    Par défaut
    Au cas ou 'alt' précède 'src' on peut utiliser cette forme:

    Mais peut-être le module HTML::LinkExtor (http://search.cpan.org/~gaas/HTML-Pa...L/LinkExtor.pm) serait plus convenable que des regex -- il prévoit toutes les variantes pathologiques.

  4. #4
    LFC
    LFC est déconnecté
    Membre régulier
    Profil pro
    Inscrit en
    Février 2003
    Messages
    106
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2003
    Messages : 106
    Points : 70
    Points
    70
    Par défaut
    Ok, mais comment est-ce que je fais pour l'attribuer en variable ?
    J'ai écrit :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
     
    #!/usr/bin/perl -w
     
    open(IN,"http://www.monsite.com/index.html");
    my @tabular = <IN>;
     
    foreach my $line(@tabular)
    {
            chomp($line);
            # faire quelque chose avec $line
            $image = m/<(img src[^>]+)>/i;
            print "$image\n";
    }
     
    close(IN);
    Et là, il devrait m'afficher que des lignes de balises images, n'est ce pas ?

    Mais je pense qu'il y a beaucoup d'erreurs encore...

    Merci de votre aide.

  5. #5
    Membre du Club
    Inscrit en
    Août 2004
    Messages
    50
    Détails du profil
    Informations forums :
    Inscription : Août 2004
    Messages : 50
    Points : 60
    Points
    60
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    ...
            $image =~ m/<(img src[^>]+)>/i;  # pas '=', mais '=~'
            print "$1\n";                    # 1-re balise
    ...

  6. #6
    Expert éminent
    Avatar de Jedai
    Homme Profil pro
    Enseignant
    Inscrit en
    Avril 2003
    Messages
    6 245
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : Enseignant

    Informations forums :
    Inscription : Avril 2003
    Messages : 6 245
    Points : 8 586
    Points
    8 586
    Par défaut
    Non, il faut spécifier la variable concernée par ses actions, lorsqu'il ne s'agit pas de $_ . Ici il s'agit de $line (et pas de $image) :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
     
    #!/usr/bin/perl -w
     
    open(IN,"http://www.monsite.com/index.html");
    my @tabular = <IN>;
     
    foreach my $line(@tabular)
    {
            chomp($line);
            # faire quelque chose avec $line
            $image = ( $line =~ m/<(img.+?src[^>]+)>/i );
            print "$image\n";
    }
     
    close(IN);
    Là ça devrait donner quelque chose.

    --
    Jedaï

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Site web] Recherche de codeur PHP, XHTML, CSSpour jol
    Par Draxtar dans le forum Projets
    Réponses: 1
    Dernier message: 20/08/2007, 09h41
  2. [access + web] recherche automatique
    Par maxdwarf dans le forum Access
    Réponses: 1
    Dernier message: 15/06/2006, 10h55
  3. Réponses: 2
    Dernier message: 05/10/2004, 22h43

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo