Comment définir des mots reservés dans une grammaire Perl6 ?

**jeepc** · 07/03/2017, 00h01

Bonjour,

Encore une question la rédaction de grammaire en Perl6.

Je prend conscience du besoin de définir des mots clés ( ou mots réservés) dans une grammaire. Par contre, je n'ai pas trouvé comment faire. Pourriez-vous m'indiquez comment ?

Pour illustrer mon besoin, prenons le testcase suivant (simplification du parsing d'un ordre SQL, seul la clause from est défini) :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
use Grammar::Tracer;
 
grammar TEST {
 
 
rule  TEST         { <from> <where> }
  rule  from              {:i FROM <selectedtable> [',' <selectedtable>]* }
    rule  selectedtable   {[<shema_name>'.']?<tablename>['@'<linkname>]? [<alias>]? }
        token shema_name  { <identifier> }
        regex tablename   { <identifier> }
        token linkname    { <identifier> }
        regex alias       { <identifier> }
        token identifier  {:i <ident>+ }
  rule where              {:i WHERE .* }
    regex comma   {',' }
}
 
 
my $fic = q:to/FIN_INI/;
FROM table1 ,table2 t2  WHERE t1 = t2(+) 
FIN_INI
 
 
say TEST.parse($fic, rule => 'TEST');

**Lolo78** · 07/03/2017, 12h18

Bonjour,

le problème est que ta règle identifier utilisée pour définir quatre autres règles n'est pas assez discriminante, du coup elle reconnaît trop de choses. Mais si un alias peut être un identifiant à peu près quelconque, alors il n'y a pas trop de solution pour la rendre non discriminante.

Il faut donc procéder autrement.

Il est sans doute possible d'ajouter une assertion pour dire que l'alias ne doit pas être un "where" ou un 'WHERE", mais ça ne me paraît pas très satisfaisant.

Du coup, la solution pourrait être d'autoriser le moteur de regex à faire un retour arrière pour trouver le "where" ou "WHERE" même s'il avait été initialement consommé par la règle alias. Donc, utiliser des règles de type regex au lieu de rule:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
 
rule  TEST           { <from> <where> }
regex  from          {:i :s FROM <selectedtable> [',' <selectedtable>]* }
regex selectedtable  {:s [<shema_name>'.']?<tablename>['@'<linkname>]? [<alias>]? }
...

Note que je dois ajouter un adverbe :s (sigspace) pour garder le comportement sigspace d'une rule après en avoir fait une regex.

**jeepc** · 08/03/2017, 00h23

**Lolo78** · 08/03/2017, 08h14

Re assertions vs. retour arrière, en fait, c'est probablement discutable, c'est juste mon impression personnelle.

Une assertion, ce n'est pas très flexible et ça devient a priori plus complexe dès qu'on veut gérer plusieurs mots; il me semble qu'une assertion sort un peu de la logique des grammaires et des regex, que c'est en quelque sorte une verrue procédurale au milieu d'un système de programmation essentiellement déclarative. Ce qui ne veut pas dire que je rejette les assertions, bien au contraire, c'est super pratique pour bien des choses difficiles à exprimer sous le forme de regex ou de règles.

Dans le cas en question, utiliser le retour arrière me paraît être plus dans l'esprit des regex et des grammaires, donc plus satisfaisant intellectuellement. Mais peut-être qu'un expert des grammaires (ce que je ne suis pas du tout, je suis encore un modeste débutant dans ce domaine) aurait un avis contraire.

**jeepc** · 08/03/2017, 16h39

Merci beaucoup pour cet avis qui m'aide à mieux comprendre.
J'avoue que je testerai bien l'assertion... mais je n'ai pas trouvé comment faire. Une idée ? Sinon ce n'est pas très grave, j'ai déjà une solution, c'est très bien.

Merci encore.
Bien cordialement,

**Lolo78** · 09/03/2017, 00h37

Le plus simple pour l'utilisation d'une assertion est peut-être une assertion de type code (code assertion), mais je m'aperçois que je n'ai apparemment pas décrit réellement ce type d'assertion dans mon tutoriel (il faudra que j'ajoute quelque chose), j'ai juste donné un exemple dans la section 4.2.4 Reconnaître une adresse IP.

Dans ton cas, on peut faire par exemple ceci (je suis reparti du code de ton post d'origine):

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
 
use Grammar::Tracer;
 
grammar TEST {
 
 
rule  TEST         { <from> <where> }
  rule  from              {:i FROM <selectedtable> [',' <selectedtable>]* }
    rule  selectedtable   {[<shema_name>'.']?<tablename>['@'<linkname>]? [<alias>]? }
        token shema_name  { <identifier> }
        regex tablename   { <identifier> }
        token linkname    { <identifier> }
        regex alias       { <identifier> <!{ $<identifier> ~~ /:i where/ }> }
        token identifier  {:i <ident>+ } }>
  rule where              {:i WHERE .* }
    regex comma   {',' }
}

Le seul changement à ton code d'origine est dans la regex alias. qui précise que l'identifiant capturé par la règle alias ne doit pas reconnaître where (casse indifférente).

Il y a des chances que cette solution avec assertion soit un peu plus rapide que celle consistant à remplacer des rules par des regex pour permettre le retour arrière (je n'ai pas vérifié), mais ça n'a pas forcément beaucoup d'importance.

Sinon, une assertion avant (voir 2-10-1. Assertions avant) devrait aussi pouvoir faire l'affaire.

Edit: Correction de l'assertion qui était fausse (c'était; <!{ $<identifier> !~~ /:i where/ >} }, avec mauvaise fermeture de l'assertion. Je corrige pour ceux qui voudraient tester le code.

Comment définir des mots reservés dans une grammaire Perl6 ? [perl6]

Langage Perl

Vue hybride

Discussions similaires

Partager

Partager