-
Parser du code c++
Bonjour a tous,
Après plusieurs jour de recherche je me tourne vers vous.
Je cherche a parser du code C++ afin de pouvoir:
- Compter le nombre d'argument d'une méthode/fonctions
- Compter le nombre de ligne d'un méthode/fonctions
- etc...
Pour ce faire j'ai tout d’abord essayé a grand coup de regex, mais cela n'a pas aboutie (Trop de cas a géré, les regex deviennent vraiment trop illisible).
Maintenant je me suis tourné vers ANTLR4. Malheureusement je n'arrive pas a trouver une grammaire pour le C++ (j'ai trouver une grammaire pour le C ici https://github.com/antlr/grammars-v4 )
Donc savez-vous ou je peut trouver une grammaire pour le C++ pour ANTLR4 ?
Ou connaissez vous un autre moyen de faire ce que je veux ?
Je vous remercie par avance pour votre aide ;)
-
La grammaire C++ est disponible pour Antlr V3. Je ne sais pas ce que la V4 change.
-
Je viens d'essayer en utilisant la V3 et bizarrement je me retrouve avec des fichier c++ et non java 8O
Une idée du pourquoi ?
PS: j'ai prit la grammaire "CPP_grammar_.g" dans cette archive
http://www.antlr3.org/grammar/129592...arser4.1.0.zip
-
Les grammaires ANTLR peuvent inclure n'importe quel langage ou presque : http://www.antlr.org/wiki/display/AN...ration+Targets
Elle a probablement était écrite par un développeur C++ (c'est mieux de bien connaitre le langage si on veut le parser :mouarf:) en C++ car c'est le langage qu'il maitrise le mieux.
Le Java est le langage le plus utilisé car Terence Parr, le créateur de ANTLR, code en Java et donc la plupart des exemples du wiki/tuto sont fait en Java.
La grammaire que tu utilises devrait bien marcher. Par contre, il faut modifier le fichier .g pas le fichier C++ générer. Le comptage du nombre d'arguments ne devrait pas être compliqué à mettre en place par contre compter le nombre de lignes risque d'être compliqué, les espaces et sauts de ligne sont supprimés par la première étapes du parseur. Il faut cheater un peu : les Token ont une méthode getLine(). Donc tu récupères la ligne du premier token de ma méthode et ma ligne du dernier token de la méthode tu soustraits et tu as le nombre de ligne. Voilà !