IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Question concernant les Regex


Sujet :

Python

  1. #1
    Membre averti
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Avril 2016
    Messages
    26
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Pologne

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Avril 2016
    Messages : 26
    Par défaut Question concernant les Regex
    Bonjour,

    Je rencontre un probleme sans doute banal, mais j'avoue que je seche: je cherche a rajouter de la coloration syntaxique pour l'affichage des requetes SQL. En l'occurence, je veux colorer en vert les commentaires de ma requete SQL:

    query = re.sub(r"(/\*.*\*/)", r" <font color='green'>\1</font> ", query) # Balises autour des commentaires /* ...... */

    Le probleme se pose lorsque ma requete possede plusieurs commentaires. Dans ce cas, Python entoure le "plus gros morceau" et met du coup toute la requete en vert.
    Par exemple: query = "select * from /* ...... */ where blablabla /* ........ */ order by xxxxx"
    devient: "select * from <font color='green'> /* ........ */ where blablabla /* ......... */ </font> order by xxxxx;"

    au lieu de: query = "select * from <font color='green'>/* ...... */</font> where blablabla <font color='green'>/* ........ */</font> order by xxxxx"

    Quelqun'aurait une idee ?

    Merci d'avance

  2. #2
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 741
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 741
    Par défaut
    Salut,

    Le "?" dit de parser la plus petite chaine:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    query = re.sub(r"(/\*.*?\*/)", r" <font color='green'>\1</font>  ", query)
    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Membre averti
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Avril 2016
    Messages
    26
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Pologne

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Avril 2016
    Messages : 26
    Par défaut Merci !
    Merci, je ne connaissais pas, pour moi le "?' voulait juste dire de 1 et + jusqu'a l'infini de repetitions du caractere qui le precede. Je ne connaissais pas cet usage. Merci beaucoup !

  4. #4
    Expert confirmé Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 986
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 986
    Par défaut
    Oui, si tu veux passer les sauts de ligne tu dois aussi ajouter le modificateur singleline (?s). Tu peux aussi te passer du groupe de capture en te référant au match complet avec \g<0> dans la chaîne de remplacement:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    query = re.sub(r"/\*.*?\*/(?s)", r" <font color='green'>\g<0></font>  ", query)
    Maintenant, parser un langage de programmation comme le SQL est quelque chose de plutôt ardu, et le faire avec des regex est plutôt déconseillé car les langages sont complexes et que les patterns naïves se prendront les pieds dedans, exemple:
    Code SQL : Sélectionner tout - Visualiser dans une fenêtre à part
    select '/* une chaîne', 'une autre chaîne */'

    Si tu veux faire une coloration syntaxique pour du SQL, tu peux utiliser:
    • sqlparse qui te simplifiera la vie, vu qu'il séparera la requête en tokens pour toi (méthode sqlparse.parse()) en renvoyant une liste d'objets qui ont comme propriétés le type (ttype) et la valeur (value). Par contre sqlparse est un peu simplet et peut te sortir n'importe quoi avec une requête un peu compliquée.
    • pyparsing qui est l'arme absolue. Par contre tu devras décrire toi même la grammaire du SQL que tu souhaites coloriser, ce qui représente un travail assez important.
    • les regex que je place en dernier car pour avoir un résultat satisfaisant tu devras faire pratiquement le même travail qu'avec pyparsing mais version regex, c'est à dire en décrivant tous les types de token possibles. D'ailleurs, si tu fais ce choix, mieux vaut te tourner vers le module regex qui permet de définir des listes nommées (utile pour ranger les mots-clef du langage), des groupes nommés contenant des références à d'autres groupes, l'ancre \G qui force les matches à être contiguës.

  5. #5
    Expert confirmé Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 041
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 041
    Par défaut
    salut,

    Citation Envoyé par JacekB Voir le message
    pour moi le "?' voulait juste dire de 1 et + jusqu'a l'infini de repetitions du caractere qui le precede.
    non pas du tout, tu confonds avec le + je pense

    • abc+ signifie qu'on a la chaine ab suivie de un ou plusieurs c, donc abc, abcc, abcccccc etc.
    • (abc)+ pourra matcher une ou plusieurs fois la répétition du groupe capturé, donc abc, abcabc, abcabcabcabcabc etc.
    • abc* signifie qu'on a la chaine ab suivie de zéro ou plusieurs c, donc ab, abc, abccc etc.
    • abc? signifie que le caractère qui précède le ? est optionnel, on pourra donc matcher soit ab soit abc
    • a(bc)? signifie que le groupe capturé est optionnel, donc on peut matcher soit a soit abc
    • dans .+?abc le +? est un opérateur un peu spécial qu'on appelle "non-greedy" (non gourmand, il en va de même pour *?) et qui cherchera la première occurrence de abc dans la chaine au lieu de chercher la dernière

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. question concernant les fichier.bin
    Par argon dans le forum Autres Logiciels
    Réponses: 10
    Dernier message: 27/08/2005, 17h44
  2. Questions concernant les études supérieures et travails
    Par Vivian Pennel dans le forum Etudes
    Réponses: 25
    Dernier message: 21/06/2005, 15h23
  3. Réponses: 11
    Dernier message: 21/06/2005, 10h16
  4. [Débutant] Deux questions concernants les vues
    Par 13obscur dans le forum Eclipse Platform
    Réponses: 1
    Dernier message: 19/04/2005, 14h29
  5. Réponses: 7
    Dernier message: 10/09/2004, 14h28

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo