IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Compréhension problème regex


Sujet :

Langage Perl

  1. #1
    Membre averti
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Mai 2013
    Messages
    247
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2013
    Messages : 247
    Points : 406
    Points
    406
    Par défaut Compréhension problème regex
    Bonjour à tous, je souhaiterais votre aide afin de comprendre un petit problème rencontré avec une regex
    Quand je fais
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    if ( $_ =~ /<(R_.*)\s+.*"><balise1>(.*)<\/balise1><balise2>(.*)<\/balise2>.*?(?:<balise3>(.+?)<\/balise3>)?.*?(?:<balise4>(.+?)<\/balise4>)?/ )
    je filtre bien les lignes qui m'intéressent c'est à dire quand il y a au moins une des balises 3 et4, mais le problème vient de la récupération des valeurs

    Je récupère sans problème $1, $2 et $3 mais $4 et $5 reste 'unitilized'

    Apparemment ça provient du fait que les balises soient facultatives mais j'ai pas trouvé pourquoi et j'aimerais bien comprendre.
    D'avance merci pour votre aide

  2. #2
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 820
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 820
    Points : 499 184
    Points
    499 184
    Par défaut
    Bonjour,

    Sans devoir expliquer quoique ce soit, j'imagine que tu essayes d'analyser du XML. Si oui, c'est une très très très mauvaise idée de le faire à coup de regex.

  3. #3
    Membre averti
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Mai 2013
    Messages
    247
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2013
    Messages : 247
    Points : 406
    Points
    406
    Par défaut
    non j'analyse des fichiers de log dont une partie à un format sous forme de balises genre XML
    Si j'avais que du XML je n'aurais pas fait comme ça

  4. #4
    Rédacteur/Modérateur

    Avatar de Lolo78
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Mai 2012
    Messages
    3 612
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2012
    Messages : 3 612
    Points : 12 469
    Points
    12 469
    Billets dans le blog
    1
    Par défaut
    Donne un exemple de données en entrée pour lesquelles $4 et $5 ne sont pas renseignés.

  5. #5
    Membre averti
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Mai 2013
    Messages
    247
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2013
    Messages : 247
    Points : 406
    Points
    406
    Par défaut
    Les données en entrée peuvent être des formes suivantes:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    <R_monidentifiant version="00.01"><balise1>toto</balise1><balise2>tata</balise2><balise3>000</balise3><balise4>001</balise4>
    <R_monidentifiant version="00.01"><balise1>toto</balise1><balise2>tata</balise2><balise3>000</balise3>
    <R_monidentifiant version="00.01"><balise1>toto</balise1><balise2>tata</balise2><balise4>001</balise4>
    il n'existe pas de cas où les balise 3 ET 4 sont absentes

    mais avec ma regex, je récupère bien: "R_monidentifiant", "toto", "tata"
    MAIS PAS "000" ou "001" (message d'erreur lors du print car valeur "uninitialized" même si la balise et la valeur voulue sont présentes)

    Je n'ai en revanche aucun problème si je fais en 2 temps
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    if ( $_ =~ /<(R_.*)\s+.*"><balise1>(.*)<\/balise1>/){
         my $code1 = $1 if ($_ =~ /<balise3>(.+?)<\/balise3>/);
         my $code2 = $1 if ($_ =~ /<balise4>(.+?)<\/balise4>/);
    }

  6. #6
    Rédacteur/Modérateur

    Avatar de Lolo78
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Mai 2012
    Messages
    3 612
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2012
    Messages : 3 612
    Points : 12 469
    Points
    12 469
    Billets dans le blog
    1
    Par défaut
    Je viens d'essayer. Avec ta première ligne, j'obtiens:

    ($1..$5) = R_monidentifiant, toto, tata, 000, 001

    Avec ta deuxième ligne:

    ($1..$4) = R_monidentifiant, toto, tata, 000,

    Et ta troisième ligne:

    ($1..$5) = R_monidentifiant, toto, tata, , 001

    Autrement dit, les 5 valeurs sont bien retrouvées avec ta première ligne; avec la seconde, $5 est non initialisé (normal, il n'y a pas de reconnaissance) et avec ta troisième ligne, c'est $4 qui n'est pas initialisé (normal à nouveau, puisque le quatrième groupe capturant n'a rien reconnu).

  7. #7
    Membre averti
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Mai 2013
    Messages
    247
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2013
    Messages : 247
    Points : 406
    Points
    406
    Par défaut
    ok merci donc le problème ne vient pas de la regex
    tu as testé avec quelle version de Perl et quel OS ?

    je suis sous perl, v5.8.4 built for sun4-solaris-64int

  8. #8
    Rédacteur/Modérateur

    Avatar de Lolo78
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Mai 2012
    Messages
    3 612
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2012
    Messages : 3 612
    Points : 12 469
    Points
    12 469
    Billets dans le blog
    1
    Par défaut
    Testé sous Perl v5.8.6 built for VMS_AXP.

    Mais comme la regex n'a rien de particulier, je pense que ça doit marcher avec à peu près n'importe quelle version de Perl 5 (en tous les cas pour sûr n'importe quelle version supérieure ou égale à 5.6).

  9. #9
    Membre averti
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Mai 2013
    Messages
    247
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mai 2013
    Messages : 247
    Points : 406
    Points
    406
    Par défaut
    ouais bizarre
    merci pour ton aide Lolo

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. problème regex please
    Par mariafan dans le forum Langage
    Réponses: 11
    Dernier message: 03/05/2007, 17h35
  2. [RegEx] Problème regex et caractère \
    Par Kyom dans le forum Langage
    Réponses: 2
    Dernier message: 05/04/2007, 16h07
  3. Problème regex VSFTPD
    Par goldkey dans le forum Réseau
    Réponses: 1
    Dernier message: 19/01/2007, 17h55
  4. [RegEx] Problème regex url cliquable
    Par dorian53 dans le forum Langage
    Réponses: 5
    Dernier message: 16/11/2006, 19h17
  5. [RegEx] Problème Regex PCRE
    Par raptorman dans le forum Langage
    Réponses: 6
    Dernier message: 07/07/2006, 17h23

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo