Regex - Utilisation quantificateur non gourmand

**ptonnerre** · 27/06/2018, 12h07

Bonjour,

j'ai en entrée la chaîne de caractères :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

ressources=PRD_PenPenAXVI13 <> A TRAITER [liberation==oui]

et souhaite extraire le nom de la ressource, ici PRD_PenPenAXVI13

J'y arrive avec le code suivant :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
 
if ( $str =~ /^ ([^\s]+) \s+ .+ $/x ) {
    push @{$r_h->{$env}->{'ressources'}->{$1}->{'jobs'}}, $job;
}

Par contre, je dois bugger sur un truc, je n'y arrive pas en utilisant les quantificateurs non gourmands !
J'ai essayé /^ (.+) \s+? .+ $/x et diverses variantes pas meilleures comme /^ ((.+) \s)+? .+ $/x

Si quelqu'un peut m'éclairer, parce que je tourne en rond sur ce point.

Merci
--
Patrick

**disedorgue** · 27/06/2018, 13h17

Pour que l'on puisse te donner une réponse correcte à ton besoin, il faudrait que tu nous dises ce que tu veux faire au juste, car tes regex ne semble pas du tout faire ce que tu veux, si dans ta chaine tu avais tototiti=tata djdjdj sjsjsj ça fonctionnerait aussi et $1 retournerait tototiti=tata...
Et en dessous tu lui dis dit que c'est la valeur de ressources que tu veux et même pas sur la même variable...

**ptonnerre** · 27/06/2018, 14h01

Désolé, je vais essayer de reformuler.

L'entrée complète, listant les différentes ressources séparées par une virgule, est la suivante :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

ressources=PRD_PenPenAXVI13 <> A TRAITER [liberation==oui],PRD_PenPenAXVI31 = CFT CNTDF1 RECU [liberation==oui],PRD_PenPenAXVI32 = CFT CNTDF2 RECU [liberation==oui]

Le code mis à jour pour cette partie est :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
 
} elsif ( $record =~ /^ ressources= (.+) $/x ) {
     my @rsc = split /,/, $1;    # @rsc = ('PRD_PenPenAXVI13 <> A TRAITER [liberation==oui]' , 'PRD_PenPenAXVI31 = CFT CNTDF1 RECU [liberation==oui]' , 'PRD_PenPenAXVI32 = CFT CNTDF2 RECU [liberation==oui]')
 
     foreach my $str ( @rsc ) {
         if ( $str =~ /^ ([^\s]+) \s+ .+ $/x ) {
             say $1;  # affiche  PRD_PenPenAXVI13 puis PRD_PenPenAXVI31 et enfin PRD_PenPenAXVI32
         }
    }
}

Mon besoin est donc d'extraire le nom de chaque ressource de ma chaîne de caractères et de l'afficher (say $1).

J'y arrive avec l'expression régulière $str =~ /^ ([^\s]+) \s+ .+ $/x, mais cette solution ne me satisfait qu'à moitié, et je souhaiterai y arriver avec une expression régulière utilisant un quantificateur non gourmand

**disedorgue** · 27/06/2018, 15h48

Ok, dans ce cas, interprétons tes regex:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

/^ ([^\s]+) \s+ .+ $/x

Sans le connecteur x, celle-ci est équivalente à:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

/^([^\s]+)\s+.+$/

^ ==> comme il est situer en début de regex, c'est pour dire "début de chaine"
([^\s]+) ==> au moins un caractère différent d'un type espace que l'on sauvegarde dans un argument (ici $1, puisque c'est le premier).
\s+ ==> au moins un type d'espace
.+$ ==> au moins quelque chose une fois.
Tout ceci peut se traduire par prendre une chaine ne commençant pas par un type espace que l'on sauvegardera dans l'argument 1 si celle ci est suivant au moins d'un type espace + au moins un caractère quelconque avant de se terminer.

Avec la suppression de gourmandise, il faut le penser légèrement différemment:
prendre toute la chaine du début jusqu'au premier type espace non compris que l'on sauvegardera dans l'argument 1 si celle ci est suivant au moins d'un type espace + au moins un caractère quelconque avant de se terminer.
ce qui donne:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

/^(.*?)\s+.+$/

et si on rajoute le connecteur x, elle peut s'écrire:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

/^ (.*?) \s+ .+ $/x

Ici, on utilise un '*' au lieu du '+' pour ne pas prendre en compte un espace en début de chaine (en gros, avec le '+' la suppression de la gourmandise commence à +1 alors qu'avec le '*' elle commence à +0.

**ptonnerre** · 27/06/2018, 18h24

Merci, je teste cela demain et te tiens au courant.

**Lolo78** · 28/06/2018, 00h44

Bonsoir Patrick,

je fais remarquer qu'avec ta première regex (quantificateurs avides ou gourmands), tu ne récupères pas le seul nom de la ressource (PRD_PenPenAXVI13) comme tu le dis dans le texte du post, mais la chaîne de caractères plus large du genre ressources=<nom_ressource>, comme on peut le voir dans ce test sous le debugger Perl.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
 
  DB<1> $str = 'ressources=PRD_PenPenAXVI13 <> A TRAITER [liberation==oui]';
 
  DB<2> print $1 if $str =~ /^ ([^\s]+) \s+ .+ $/x
ressources=PRD_PenPenAXVI13

Le motif /^ ([^\s]+) \s+ .+ $/x capture tous les caractères autres que des espaces depuis le début de la chaîne jusqu'au(x) premier(s) caractère(s) de type espace (à condition cependant qu'il y ait encore au moins un caractère autre qu'un espace après le ou les espaces détectés par \s+ ).

En fait, compte tenu de ce que tu cherches à faire et de la chaîne de caractères à analyser (et sachant qu'un motif n'a pas besoin de reconnaître toute la chaîne pour réussir, il suffit en sens inverse que le motif soit entièrement utilisé dans la reconnaissance), je pense que la seconde partie de la regex ne sert probablement à rien et que le motif /^([^\s]+)/ serait suffisant pour tes besoins:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
 
  DB<3>  print $1 if $str =~ /^([^\s]+)/;     # Ou: /^ ([^\s]+)/x si tu préfères
ressources=PRD_PenPenAXVI13

Si tu veux absolument utiliser un quantificateur frugal ou non gourmand (je ne vois trop pourquoi, mais, bon, pourquoi pas?), alors on peut supposer que tu désires capturer tous les caractères depuis le début de la ligne jusqu'au premier espace, ce qui peut se traduire par le motif /^ (.+?) \s /x. Exemple sous le debugger:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
 
  DB<4> print $1 if $str =~ /^ (.+?)  \s /x;
ressources=PRD_PenPenAXVI13
  DB<5>

Regex - Utilisation quantificateur non gourmand

Langage Perl

Vue hybride

Discussions similaires

Partager

Partager