IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Regex tabulation perl


Sujet :

Langage Perl

  1. #1
    Nouveau membre du Club
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Octobre 2014
    Messages
    38
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 33
    Localisation : France, Vosges (Lorraine)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Octobre 2014
    Messages : 38
    Points : 26
    Points
    26
    Par défaut Regex tabulation perl
    Bonjour tout le monde,

    Je viens vers vous car j'ai un petit soucis d'expression régulière, j'ai un script perl qui convertit un mutt en vcard. J'utilise des expressions régulières pour tester mes lignes. Si dans mes lignes j'ai seulement des espaces tous fonctionne correctement je récupère bien mes infos. Le problème c'est si j'ai une tabulation entre 2 mots je n'arrive pas a le détecter et ma ligne et alors ignorer.

    Mon code est le suivant.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
    while(<READ>){
         if(m/^alias\s+(\S+)\s+(\S+)\s+<(.*)>/){
               print "OK TAB ";
         }elsif (m/^alias ([^\s]*) (.*) (<.*>)/) {
               print "OK NO TAB"; //ce test fonctionne correctement
         }
    }
    le type de ligne que je parcourt est du type
    alias toto tata <toto.tata@mail.com> //ligne sans tabulation
    alias test test <test.test@test.com> //cette ligne comporte une tabulation

    Si quelqu'un aurait une petite idée
    Merci

  2. #2
    Membre habitué
    Homme Profil pro
    Ingénieur intégration
    Inscrit en
    Juillet 2014
    Messages
    84
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Ingénieur intégration
    Secteur : Conseil

    Informations forums :
    Inscription : Juillet 2014
    Messages : 84
    Points : 197
    Points
    197
    Par défaut
    j'ai testé avec le bout de code suivant :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    my @tab = ();
    push(@tab, 'alias toto tata <toto.tata@mail.com>');
    push(@tab, 'alias	test test <test.test@test.com>');
     
    foreach(@tab){
         if(m/^alias\s+(\S+)\s+(\S+)\s+<(.*)>/){
               print "OK TAB\n";
         }elsif (m/^alias ([^\s]*) (.*) (<.*>)/) {
               print "OK NO TAB\n";
         }
    }
    et je n'ai pas eu de problème.

    ce doit être le saut de ligne qui pose problème.
    Rajoute un appel à la fonction chomp, ça devrait fonctionner :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    while(<READ>){
         chomp;
         if(m/^alias\s+(\S+)\s+(\S+)\s+<(.*)>/){
               print "OK TAB ";
         }elsif (m/^alias ([^\s]*) (.*) (<.*>)/) {
               print "OK NO TAB"; //ce test fonctionne correctement
         }
    }
    edit : j'ai peut être mal compris le problème, à voir.

  3. #3
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    Je ne comprends pas bien : dans ton script, tu as 2 expressions régulières : la première prend \s+ comme séparateur de mots (ce qui me semble une bonne chose). La deuxième prend juste le caractère espace (une seule occurrence) : avec cette dernière, tu ne devrais pas pouvoir isoler tes mots s'ils sont séparés par plusieurs espaces ou tabulation (plus d'un), ou par une tabulation. La première devrait fonctionner.
    Avec ton exemple de lignes à convertir, ton script me retourne par exemple "OK TAB OK TAB"... ce que je trouve normal.
    Plus j'apprends, et plus je mesure mon ignorance (philou67430)
    Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
    Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
    Si c'est utile, say

  4. #4
    Expert éminent Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 858
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 858
    Points : 6 556
    Points
    6 556
    Par défaut
    Il n'y a aucune raison qu'une tabulation pose problème vu que tu utilises \s qui matche aussi bien l'espace que la tabulation. De plus je ne vois pas l'intérêt de faire de la tabulation un cas à part.

    Par contre, tu présupposes que la partie "nom long" de ta ligne d'alias est composée d'un seul mot, or ce n'est pas forcément le cas: alias toto Robin des bois <toto.sherwood@mail.com>.

    Si on part du principe que tes lignes ressemblent à ça: alias nickname nom long <adresse@email.com>, moi j'utiliserai une pattern de ce style:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    ^alias\h+(\S+)\h+(.*?)\h+<(.*)>
     
    # ou une version plus guidée
    ^alias\h+(\S+)\h+(\S+(?:\h+[^\s<]+)*+)\h+<([^>]*)>
    Brachygobius xanthozonus
    Ctenobrycon Gymnocorymbus

  5. #5
    Nouveau membre du Club
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Octobre 2014
    Messages
    38
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 33
    Localisation : France, Vosges (Lorraine)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Octobre 2014
    Messages : 38
    Points : 26
    Points
    26
    Par défaut
    Merci à tous pour vos réponses,
    oui je me suis un peu emmêler les pinceaux entre mes expressions régulière, c'est pas ce que je préfère disons

    Citation Envoyé par CosmoKnacki Voir le message
    Il n'y a aucune raison qu'une tabulation pose problème vu que tu utilises \s qui matche aussi bien l'espace que la tabulation. De plus je ne vois pas l'intérêt de faire de la tabulation un cas à part.

    Par contre, tu présupposes que la partie "nom long" de ta ligne d'alias est composée d'un seul mot, or ce n'est pas forcément le cas: alias toto Robin des bois <toto.sherwood@mail.com>.

    Si on part du principe que tes lignes ressemblent à ça: alias nickname nom long <adresse@email.com>, moi j'utiliserai une pattern de ce style:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    ^alias\h+(\S+)\h+(.*?)\h+<(.*)>
     
    # ou une version plus guidée
    ^alias\h+(\S+)\h+(\S+(?>\h+[^\s<]+)*)\h+<([^>]*)>

    Effectivement tes patterns résolvent mon problèmes, mon deuxième test était complètement inutile effectivement.

    Encore merci

  6. #6
    Nouveau membre du Club
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Octobre 2014
    Messages
    38
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 33
    Localisation : France, Vosges (Lorraine)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Octobre 2014
    Messages : 38
    Points : 26
    Points
    26
    Par défaut
    Citation Envoyé par Philou67430 Voir le message
    Je ne comprends pas bien : dans ton script, tu as 2 expressions régulières : la première prend \s+ comme séparateur de mots (ce qui me semble une bonne chose). La deuxième prend juste le caractère espace (une seule occurrence) : avec cette dernière, tu ne devrais pas pouvoir isoler tes mots s'ils sont séparés par plusieurs espaces ou tabulation (plus d'un), ou par une tabulation. La première devrait fonctionner.
    Avec ton exemple de lignes à convertir, ton script me retourne par exemple "OK TAB OK TAB"... ce que je trouve normal.
    Exact ma deuxième expression était totalement inutile

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 1
    Dernier message: 25/03/2010, 22h24
  2. regex : différence entre Perl et Python
    Par rambc dans le forum Général Python
    Réponses: 3
    Dernier message: 08/01/2009, 20h53
  3. regex en perl
    Par flavia dans le forum Langage
    Réponses: 5
    Dernier message: 16/07/2008, 11h21
  4. Perl & Regex
    Par Fluxy dans le forum Langage
    Réponses: 5
    Dernier message: 25/02/2007, 12h46
  5. [Regex perl] Matcher un gros fichier
    Par osoumayaj dans le forum Collection et Stream
    Réponses: 2
    Dernier message: 18/01/2007, 09h37

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo