grammaire hors contexte LL, exposant et opérations associatives à droite
par
, 02/01/2022 à 02h09 (354 Affichages)
La puissance est un opérateur associatif à droite. Cela signifie que l'expression 2^2^3 est égal à 2^(2^3) et non pas à (2^2)^3
À savoir pour lire ce billet :
nb est un nombre
id est un identificateur
epsilon est la production vide
La grammaire
Soit F un facteur dans une expression (dont le non-terminal est E):
Comme l'exponentiation est prioritaire par rapport à la multiplication, il doit se trouver dans F:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 F -> nb F -> id F -> ( E ) F -> - F
On n'ajoute pas P dans la production F -> - F car P est déjà présent dans (- F).
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 F -> nb P F -> id P F -> ( E ) P F -> -F
Puis vient l'opérateur ^ d'exponentiation. Si on fait
On aura bien une opération associative à droite, mais le moins unaire aura une priorité inférieur à l'exponentiation.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 P -> ^ F P -> epsilon
L'expression v^-5^8 sera considéré comme v ^ - ( 5 ^ 8 ) au lieu de v ^ ( ( -5 ) ^ 8 ) . Nous allons donc utiliser un autre non-terminal à la place de F:
Dans la production de puiss, on isole le reste de l'expression d'exponentiation en ajoutant P après l'opérande :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 P -> ^ puiss P -> epsilon
Nous nous rappellerons que, puisque puiss est juste après l'opérateur ^, il ne peut être vide.
Code : Sélectionner tout - Visualiser dans une fenêtre à part puiss -> operandepuiss P
Il ne nous reste plus qu'à mettre les opérandes de l'exponentiation dans la production operandepuiss:
Nous remarquerons qu'il y a deux moins unaire: celui hors de l'expression d'exponentiation ( - F ), qui a une priorité inférieur à celle de l'exponentiation et celui, ( - operandepuiss ), rencontré dans une telle expression, et qui a une priorité supérieur.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 operandepuiss -> nb operandepuiss -> id operandepuiss -> ( E ) operandepuiss -> - operandepuiss
La grammaire est donc:
Code : Sélectionner tout - Visualiser dans une fenêtre à part - 7 ^ -5 ^ x = - ( 7 ^ ( (-5) ^ x ) )
voici l'arbre abstrait pour -u^3^-x
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11 F -> nb P -> id P -> ( E ) P -> - F P -> ^ puiss -> epsilon puiss -> operandepuiss P operandepuiss -> nb -> id -> ( E ) -> - operandepuiss
La traduction dirigée par la syntaxe
Nous allons faire une traduction dirigée par la syntaxe qui ajoute des parenthèses autour du deuxième opérande, ainsi qu'après le moins hors exponentiation, et autour de l'opérande négatif.
Par exemple, -u ^ -87 ^ 43 sera traduit par - ( u ^ ( ( -87 ) ^ ( 43 ) ) )
Comme l'opérateur d'exponentiation est associatif à droite, ce deuxième opérande correspond au non-terminal puiss:
Code : Sélectionner tout - Visualiser dans une fenêtre à part -u ^ -87 ^ 43 = - ( u ^ ( ( -87 ) ^ ( 43 ) ) )
Dans la définition dirigée par la syntaxe (DDS) la règle sémantique du non-terminal P, dont le symbole || est la concaténation de chaines, est :
Code : Sélectionner tout - Visualiser dans une fenêtre à part si puiss = 5 ^ ( 9 ) alors 8 ^ ( puiss ) = 8 ^ ( 5 ^ ( 9 ) )
Puisque nous n'avons pas fait la traduction des expressions (non-terminal E), F -> ( E ) devient F -> ( F ), et operandepuiss -> ( E ) devient operandepuiss -> ( F )
Code : Sélectionner tout - Visualiser dans une fenêtre à part P.s = P.h || " ^ ( " || puiss.s || " )"
Voici la définition dirigée par la syntaxe :
voici le schéma de traduction dirigé par la syntaxe:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 F -> nb P | P.h = nb.valex | F.val = P.s F -> id P | P.h = id.unilex | F.val = P.s F -> ( F1 ) P | P.h = " ( " || F1.val || " ) " | F.val = P.s F -> - F1 | F.val = " - ( " || F1.val || " ) " P -> ^ puiss | P.s = P.h || " ^ ( " || puiss.s || " ) " P -> epsilon | P.s = P.h puiss -> opérandepuiss P | P.h = operandepuiss.s | puiss.s = P.s operandepuiss -> nb | operandepuiss.s = nb.vallex operandepuiss -> id | operandepuiss.s = id.unilex operandepuiss -> ( F ) | operandepuiss.s = " ( " || F.val || " ) " operandepuiss -> - operandepuiss1 | operandepuiss.s = " ( - " || operandepuiss1.s || " ) "
ici l'arbre syntaxique décoré pour l'expression 2^x^-3,2
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11 F -> nb { P.h = nb.valex } P { F.val = P.s } F -> id { P.h = id.unilex } P { F.val = P.s } F -> ( F1 ) { P.h = " ( " || F1.val || " ) " } P { F.val = P.s } F -> - F1 { F.val = " - ( " || F1.val || " ) " } P -> ^ puiss { P.s = P.h || " ^ ( " || puiss.s || " ) " } P -> epsilon { P.s = P.h } puiss -> opérandepuiss { P.h = operandepuiss.s } P { puiss.s = P.s } operandepuiss -> nb { operandepuiss.s = nb.vallex } operandepuiss -> id { operandepuiss.s = id.unilex } operandepuiss -> ( F ) {operandepuiss.s = " ( " || F.val || " ) " } operandepuiss -> - operandepuiss1 { operandepuiss.s = " ( - " || operandepuiss1.s || " ) " }
pour terminer le billet, voici le programme, implémenté selon la méthode de la descente récursive prédictive:
main.cpp
syntaxique.hpp
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7 #include <iostream> #include "syntaxique.hpp" int main(int argc,char *argv[]){ syntaxique S(argv[1]); std::cout<<S.F()<<std::endl; }
syntaxique.cpp
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24 #ifndef SYNTAXIQUE_HPP #define SYNTAXIQUE_HPP #include <string> #include "lexicale.hpp" #include "unilex.hpp" class syntaxique{ public: syntaxique(std::string const &textedentree); void consommer(terminal s); std::string F(); std::string P(std::string const &P_h); std::string puiss(); std::string operandepuiss(); void charger(std::string textedentree); private: lexicale L; unilex a; }; #endif
lexicale.cpp:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107 #include <iostream> #include <string> #include "symboles.hpp" #include "unilex.hpp" #include "syntaxique.hpp" #include "lexicale.hpp" syntaxique::syntaxique(std::string const &textedentree):L(textedentree){ a = L.analex(); } void syntaxique::consommer(terminal s){ if( s == a.valeur ) a = L.analex(); else std::cerr<<"syntaxe incorrecte"<<std::endl; } std::string syntaxique::F(){ std::string nb_vallex,id_unilex,P_h,P_s,F_val,E_val,F1_val; if( a.valeur == nb ){ nb_vallex = a.attribut; P_h = nb_vallex; consommer( nb ); P_s = P( P_h ); F_val = P_s; return F_val; } else if( a.valeur == id){ id_unilex = a.attribut; P_h = id_unilex; consommer( id ); P_s = P( P_h ); F_val = P_s; return F_val; } else if( a.valeur == po ){ // po = parenthèse ouvrante consommer(po); F1_val = F(); consommer(pf); //pf = parenthèse fermante P_h = " ( " + F1_val + " ) "; P_s = P( P_h ); F_val = P_s; return F_val; } else if( a.valeur == moins ){ consommer(moins); F1_val = F(); F_val = "- ( " + F1_val + " ) "; return F_val; } else return "erreur"; } std::string syntaxique::P(std::string const &P_h){ std::string puiss_s,P_s; if( a.valeur == chapeau ){ consommer(chapeau); puiss_s = puiss(); P_s = P_h +" ^ ( " + puiss_s + " ) "; } else P_s = P_h; return P_s; } std::string syntaxique::puiss(){ std::string P_h,operandepuiss_s,puiss_s,P_s; operandepuiss_s = operandepuiss(); P_h = operandepuiss_s; P_s = P( P_h ); puiss_s = P_s; return puiss_s; } std::string syntaxique::operandepuiss(){ std::string nb_vallex,id_unilex,operandepuiss_s,operandepuiss1_s,F_val; if( a.valeur == nb ){ nb_vallex = a.attribut; consommer( nb ); operandepuiss_s = nb_vallex; return operandepuiss_s; } else if( a.valeur == id ){ id_unilex = a.attribut; consommer( id ); operandepuiss_s = id_unilex; return operandepuiss_s; } else if( a.valeur == po){ consommer( po ); F_val = F(); consommer( pf ); operandepuiss_s = " ( " + F_val + " ) "; return operandepuiss_s; } else if( a.valeur == moins ){ consommer(moins); operandepuiss1_s = operandepuiss(); operandepuiss_s = " ( - " + operandepuiss1_s + " ) "; return operandepuiss_s; } else return " erreur sur l'opérande "; }
lexicale.hpp
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386 #include <iostream> #include <string> #include "lexicale.hpp" #include "unilex.hpp" #include "symboles.hpp" lexicale::lexicale(std::string const &textedentree): entree(textedentree),enavant(0) { } unilex lexicale::analex(){ unsigned char c; //"unsigned" pour les utf8 de plus d'un octet while(true){ obtenirblanc(); if(reussi) continue; else echec(); obtenirid(); if(reussi) return trouve; else echec(); obtenirnb(); if(reussi) return trouve; else echec(); obtenirpo(); if(reussi) return trouve; else echec(); obtenirpf(); if(reussi) return trouve; else echec(); obtenirmoins(); if(reussi) return trouve; else echec(); obtenirchapeau(); if(reussi) return trouve; else echec(); obtenirdolar(); if(reussi) return trouve; else echec(); std::cerr << "caractère hors langage"<<std::endl; std::cerr << "les caractères doivent être : lettre, chiffre, " << "underscore, moins, parenthèse, virgule et chapeau" << std::endl; exit(1); //partie utf8 exclus: if(c<0x7f){ c=carsuiv(); } else if(c>=0xc2 && c<=0xdf){ c=carsuiv(); c=carsuiv(); } else if(c>=0xe0 && c<=0xef){ c=carsuiv(); c=carsuiv(); c=carsuiv(); } else if(c>=0xf0 && c<=0xf4){ c=carsuiv(); c=carsuiv(); c=carsuiv(); c=carsuiv(); } } } void lexicale::echec(){ reculer(debutlex); debutlex=0; } void lexicale::obtenirblanc(){ bool continuer=true; char c; int etat=0; debutlex=0; while(continuer) switch(etat){ case 0: c=carsuiv(); debutlex++; if(c==' '||c=='\t') etat=1; else{ continuer=false; reussi=false; } break; case 1: reussi=true; continuer=false; } } void lexicale::obtenirdolar(){ bool continuer=true; char c; int etat=0; debutlex=0; while(continuer) switch(etat){ case 0: c=carsuiv(); debutlex++; if( enavant - 1 == entree.length() ) etat=1; else{ continuer=false; reussi=false; } break; case 1: trouve.valeur=dolar; continuer=false; reussi=true; } } void lexicale::obtenirid(){ bool continuer=true; char c; int etat=0; debutlex=0; std::string lexeme=""; while(continuer) switch(etat){ case 0: c=carsuiv(); debutlex++; if(c == '_'){ lexeme+=c; etat=0; } else if(c>='a'&&c<='z' || c>='A' && c<='Z'){ etat=1; lexeme+=c; } else{ reussi=false; continuer=false; } break; case 1: c=carsuiv(); debutlex++; if( c >='a' && c <='z' || c >='A' && c <='Z' || c>= '0'&& c<= '9' || c=='_'){ etat=1; lexeme+=c; } else etat=2; break; case 2: reculer(1); trouve.valeur=id; trouve.attribut=lexeme; reussi=true; continuer=false; } } void lexicale::obtenirnb(){ bool continuer=true; char c; int etat=0; debutlex=0; std::string lexeme=""; while(continuer) switch(etat){ case 0: c=carsuiv(); debutlex++; if(c>='0' && c<='9'){ etat=1; lexeme+=c; } else if(c==','){ etat=5; lexeme+=c; } else{ continuer=false; reussi=false; } break; case 1: c=carsuiv(); debutlex++; if(c>='0' && c<='9'){ etat=1; lexeme+=c; } else if(c==','){ etat=2; lexeme+=c; } else etat=4; break; case 2: c=carsuiv(); debutlex++; if(c>='0' && c<='9'){ etat=3; lexeme+=c; } else{ continuer=false; reussi=false; } break; case 3: c=carsuiv(); debutlex++; if(c>='0' && c<='9'){ etat=3; lexeme+=c; } else etat=4; break; case 4: reculer(1); trouve.valeur=nb; trouve.attribut=lexeme; reussi=true; continuer=false; break; case 5: c=carsuiv(); debutlex++; if(c>='0' && c<='9'){ etat=6; lexeme+=c; } else{ continuer=false; reussi=false; } break; case 6: c=carsuiv(); debutlex++; if(c>='0' && c<='9'){ etat=6; lexeme+=c; } else etat=4; break; } } void lexicale::obtenirpo(){ bool continuer=true; char c; int etat=0; debutlex=0; std::string lexeme=""; while(continuer) switch(etat){ case 0: c=carsuiv(); debutlex++; if(c=='(') etat=1; else{ continuer=false; reussi=false; } break; case 1: trouve.valeur=po; reussi=true; continuer=false; } } void lexicale::obtenirpf(){ bool continuer=true; char c; int etat=0; debutlex=0; while(continuer) switch(etat){ case 0: c=carsuiv(); debutlex++; if(c==')') etat=1; else{ continuer=false; reussi=false; } break; case 1: trouve.valeur=pf; continuer=false; reussi=true; } } void lexicale::obtenirmoins(){ bool continuer=true; char c; int etat=0; debutlex=0; while(continuer) switch(etat){ case 0: c=carsuiv(); debutlex++; if(c=='-') etat=1; else{ continuer=false; reussi=false; } break; case 1: trouve.valeur=moins; continuer=false; reussi=true; } } void lexicale::obtenirchapeau(){ bool continuer=true; char c; int etat=0; debutlex=0; while(continuer) switch(etat){ case 0: c=carsuiv(); debutlex++; if(c=='^') etat=1; else{ continuer=false; reussi=false; } break; case 1: trouve.valeur=chapeau; continuer=false; reussi=true; } } char lexicale::carsuiv(){ if(enavant<entree.length()) return entree[enavant++]; else return EOF; } void lexicale::reculer(int const &enarriere){ enavant-=enarriere; if(enavant<0) std::cerr<<"erreur interne: enavant négatif"<<std::endl; }
symboles.hpp
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32 #ifndef LEXICALE_HPP #define LEXICALE_HPP #include <string> #include "unilex.hpp" class lexicale{ public: lexicale(std::string const &textedentree); unilex analex(); private: void obtenirdolar(); void obtenirblanc(); void obtenirid(); void obtenirnb(); void obtenirpo(); void obtenirpf(); void obtenirmoins(); void obtenirchapeau(); void echec(); char carsuiv(); void reculer(int const &enarriere); bool reussi; unilex trouve; bool presenceErreur; int debutlex,enavant; std::string lexeme; std::string entree; }; #endif
unilex.hpp
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 #ifndef SYMBOLE_HPP #define SYMBOLE_HPP enum terminal { nb,id,po,pf,moins,chapeau,dolar }; #endif
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14 #ifndef UNILEX_HPP #define UNILEX_HPP #include <string> #include "symboles.hpp" class unilex{ public: std::string attribut; terminal valeur; }; #endifsi vous utilisez des espaces, il faudra mettre l'expression entre guillemets
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3 g++ -o puissances *cpp $ ./puissances a^b a ^ ( b )
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 $ ./puissances -u ^ -87 ^ 43 - ( u )de même avec les parenthèses
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 $ ./puissances "-u ^ -87 ^ 43" - ( u ^ ( ( - 87 ) ^ ( 43 ) ) )
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 $ ./puissances 48^(3^p) bash: erreur de syntaxe près du symbole inattendu « ( » $ ./puissances "48^(3^p)" 48 ^ ( ( 3 ^ ( p ) ) )