IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Problème avec Regex capture multiple


Sujet :

Langage Perl

  1. #1
    Nouveau membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Décembre 2015
    Messages
    43
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 43
    Points : 37
    Points
    37
    Par défaut Problème avec Regex capture multiple
    Bonjour,

    J'ai des difficultés avec une regex.

    Voilà, j'ai des chaines du type :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    $ligne = arthralgies || NEOCLASSIQUE || douleurs articulaires | douleurs des articulations | || FREQ || douleurs : 2 || articulations : 1 | articulaires : 1 |
    Et je voudrais extraire tout ce qui contient "douleurs" entre deux pipe => je devrais obtenir :

    -douleurs articulaires
    -douleurs des articulations

    Mais soit j'obtiens uniquement le premier, soit uniquement le deuxième

    Je pensais d'abord à un truc "simple" du genre :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    my @matches = ($ligne =~ /\|(.*?douleurs.*?)\|/gi);
    Mais je n'obtiens pas toutes les possibilités (j'ai uniquement la première).

    Merci d'avance pour votre aide, parce que là je sèche (et c'est pas dur avec la météo actuelle

  2. #2
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 820
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 820
    Points : 499 184
    Points
    499 184
    Par défaut
    Bonsoir,

    Essaye
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    my @matches = $ligne =~ m{\|*([^\|]*douleur[^\|]*)\|*}g;

  3. #3
    Expert éminent Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 858
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 858
    Points : 6 556
    Points
    6 556
    Par défaut
    Le problème est que le pipe qui sépare les deux champs que tu veux récupérer ne peut "être matché" deux fois (une fois à la fin du premier champ, une fois au début du deuxième). Tu peux utiliser une classe de caractère qui exclut le pipe à la place du point comme l'a fait djibril, tu peux même virer les pipes de l'expression si ça te chante.

    Comme ta ligne est composée de champs séparés par un pipe, tu peux aussi utiliser split et filtrer avec grep:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    my @result = grep { /douleurs/ } split /\|/, $ligne;
    Brachygobius xanthozonus
    Ctenobrycon Gymnocorymbus

  4. #4
    Nouveau membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Décembre 2015
    Messages
    43
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 43
    Points : 37
    Points
    37
    Par défaut
    Bonjour et Merci Djibril et CosmoKnacki pour vos réponses

    La première méthode ne me permet d'avoir que "douleurs articulaires" et pas "douleur de articulations".
    La deuxième donne bien les 2 mais j'ai en plus la fréquence "douleurs : 2" dont je n'ai pas besoin.

    Du coup, merci pour l'astuce du split, parce que ça marche en faisant d'abord un split sur le || qui me permet de conserver uniquement la partie que je veux avant de faire le deuxième split tel que montré :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    my @infos = split /\|\|/, $ligne;
    my @matches = grep { /douleurs/ }split /\|/, $infos[2];
    Encore merci pour votre aide !!

  5. #5
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    Que tu peux écrire en une seule instruction :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    my @matches = grep /douleurs/, split /\|/, (split /\|\|/, $ligne)[2]
    Plus j'apprends, et plus je mesure mon ignorance (philou67430)
    Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
    Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
    Si c'est utile, say

  6. #6
    Expert éminent Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 858
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 858
    Points : 6 556
    Points
    6 556
    Par défaut
    En fait la "première méthode" marche aussi, il faut juste remplacer le m à la fin par g (c'est juste une typo) pour avoir l'ensemble des correspondances.
    Brachygobius xanthozonus
    Ctenobrycon Gymnocorymbus

  7. #7
    Nouveau membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Décembre 2015
    Messages
    43
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 43
    Points : 37
    Points
    37
    Par défaut
    OK merci Philou67430, je ne savais pas qu'on pouvait tout condenser comme ça.

    @CosmoKnacki : je ne savais pas à quoi servait ce "m" à la fin. Je croyais qu'on ne le mettait toujours qu'en début de regex

    C'est bien j'en apprends tous les jours !

    Bonne journée

  8. #8
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    Pour le /m en fin de regexp, c'est une option (voir perldoc perlre). Il permet de considérer que les caractères spéciaux ^ et $ correspondent à un début ou une fin de ligne n'importe où dans la chaine et non uniquement au début ou à la fin de cette chaine (m pour "multiple lines").
    A ne pas confondre avec l'option /s (single line), qui permet elle de considérer que le caractère spécial . corresponde à n'importe quel caractère y compris un retour à la ligne (ce qui n'est pas le cas si l'option n'est pas présente). Il est d'autant plus à ne pas confondre que l'on utilise souvent ces deux options en même temps (/ms).
    Plus j'apprends, et plus je mesure mon ignorance (philou67430)
    Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
    Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
    Si c'est utile, say

  9. #9
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 820
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 820
    Points : 499 184
    Points
    499 184
    Par défaut
    le m est juste une erreur de copier/coller, c'était un g en fait . Sinon, l'idée du split est très bien et je te la recommande.

  10. #10
    Nouveau membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Décembre 2015
    Messages
    43
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 43
    Points : 37
    Points
    37
    Par défaut
    Super, merci pour toutes ces infos

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. problème avec regex
    Par mhamedbj dans le forum Langage
    Réponses: 11
    Dernier message: 15/04/2007, 12h15
  2. problèmes avec Regex sous c#
    Par santana2006 dans le forum C#
    Réponses: 2
    Dernier message: 24/01/2007, 15h42
  3. Problème avec Regex
    Par trihanhcie dans le forum Général JavaScript
    Réponses: 4
    Dernier message: 13/07/2006, 14h50
  4. Problème avec un "select multiple" et POST
    Par crazydiver_e2 dans le forum Langage
    Réponses: 2
    Dernier message: 09/06/2006, 15h54
  5. Problème avec RegEx et une Query string
    Par Erakis dans le forum Langage
    Réponses: 6
    Dernier message: 08/11/2005, 15h48

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo