IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Expression régulière sur les prénoms


Sujet :

Langage PHP

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éprouvé
    Homme Profil pro
    Ingénieur en électrotechnique retraité
    Inscrit en
    Décembre 2008
    Messages
    1 718
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 73
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur en électrotechnique retraité

    Informations forums :
    Inscription : Décembre 2008
    Messages : 1 718
    Par défaut Expression régulière sur les prénoms
    Bonjour,
    Dans une classe, je veux écrire une expression régulière qui accepte les formes suivantes:
    var_dump($chk->ctlFirstname("Michel"));
    var_dump($chk->ctlFirstname("J.-M."));
    var_dump($chk->ctlFirstname("J. Michel"));
    var_dump($chk->ctlFirstname("J.-Michel"));
    var_dump($chk->ctlFirstname("JM"));
    
    Mais pas celle-ci:
    var_dump($chk->ctlFirstname("J..-M."));
    
    J'ai le code suivant qui est trop permissif puisqu'il accepte le dernier exemple avec les deux points consécutifs : "#^[A-ZÀÁÂÆÇÈÉÊËÌÍÎÏÑÒÓÔŒÙÚÛÜÝŸ]([a-zàáâæäßçéèêëìíîïñòóôöœùúûüýÿ])?([\. -][A-ZÀÁÂÆÇÈÉÊËÌÍÎÏÑÒÓÔŒÙÚÛÜÝŸ][a-zA-Zàáâæäßçéèêëìíîïñòóôöœùúûüýÿ\.])?#%s".
    Le %s final sert à ajouter un i avec sprintf() pour l'insensibilité à la casse.

  2. #2
    Expert confirmé Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 986
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 986
    Par défaut
    Je dirais:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $pattern = '~\A \b (?: [ -]? [^\P{Lu}\P{Latin}] (?: \. | [^\P{Ll}\P{Latin}]* ) )+ \z~ux';
    démo

    Attention à ne pas imposer trop de choses à l'utilisateur.

    Dés qu'une pattern contient des caractères en dehors de la plage ASCII, il faut avoir le réflexe d'utiliser le modificateur u, sous peine d'obtenir une pattern complétement fausse.

  3. #3
    Membre Expert
    Avatar de cavo789
    Homme Profil pro
    Développeur Web
    Inscrit en
    Mai 2004
    Messages
    1 797
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Mai 2004
    Messages : 1 797
    Par défaut
    Juste par curiosité : pourquoi as-tu ce besoin ? C'est une grosse prise de tête pour finalement quel résultat ?

    Que tu interdises l'apostrophe (pour contrer une potentielle attaque par injection SQL), je le conçois, mais un double point.. Là, je me demande l'intérêt versus le travail qu'il faudra pour une regex aux petits oignons (et la difficulté de la maintenir dans le temps)

  4. #4
    Membre éprouvé
    Homme Profil pro
    Ingénieur en électrotechnique retraité
    Inscrit en
    Décembre 2008
    Messages
    1 718
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 73
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur en électrotechnique retraité

    Informations forums :
    Inscription : Décembre 2008
    Messages : 1 718
    Par défaut
    @CosmoKnacki
    Je ne trouve pas de sites qui me donne la liste de toutes les classes abrégées pour bien comprendre cette regex.

    @cavo789
    Je veux justement interdire les '..'

  5. #5
    Membre Expert
    Avatar de cavo789
    Homme Profil pro
    Développeur Web
    Inscrit en
    Mai 2004
    Messages
    1 797
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Mai 2004
    Messages : 1 797
    Par défaut
    Bah un str_replace ferait alors très bien l'affaire 😉

  6. #6
    Expert confirmé Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 986
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 986
    Par défaut
    Code x : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    Ll             Letter lowercase
    Lu             Letter uppercase
    
    Latin          Latin letters
    
    
    
    \p{L} ou \pL   Letters character class
    \p{Latin}      Latin letters character class
    
    \P{something} = [^\p{something}]
    \p{something} = [^\P{something}]

    Tu en trouveras d'autres dans la documentation de pcre : https://pcre.org/pcre2.txt

    L'astuce que j'utilise c'est une double négation pour obtenir les lettres latines majuscules: [^\P{Lu}\P{Latin}] (classe de caractères qui ne contient pas les lettres pas majuscules ou pas latine = classe de caractères qui contient les lettres à la fois latines et majuscules). La double négation permet de faire une intersection de classes de caractères (fonctionnalité qui n'est pas implémentée dans pcre, mais qu'on trouve dans les regex Java ou .net).

    Mais je viens de me rendre compte que tu veux éventuellement passer la pattern en case-insensitive. Donc tu ne peux pas utiliser \p{Ll} et \p{Lu} (qui sont insensibles au modificateur i). Mieux vaut alors écrire une seconde pattern pour ce cas précis:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $pattern_caseinsensitive = '~\A \b (?: [ -]? \p{Latin} (?: \. | \p{Latin}* ) )+ \z~ux';
    Sinon, si tu tiens à ton idée d'une seule pattern pour deux utilisations, tu peux spécifier les caractères mais sous forme de rangs (cf la table unicode pour connaître l'ordre, attention il y en a dans plusieurs plages). Par exemple, sans trop se casser la tête:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $pattern = '~(?xx) \A \b (?: [\x20 -]? [A-Z À-Ö Ø-Þ Œ Ÿ ẞ] (?: \. | [a-z ß-ö ø-ÿ œ]* ) )+ \z~u';
    (Le modificateur xx permet d'ignorer les espaces même dans les classes de caractères, c'est pour ça que j'ai remplacé l'espace par \x20).
    À toi de voir précisément ce que tu veux ou pas inclure comme caractères.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Expression régulière sur les chiffres
    Par cybercandyman dans le forum PostgreSQL
    Réponses: 4
    Dernier message: 24/02/2012, 18h48
  2. Réponses: 15
    Dernier message: 17/10/2006, 12h06
  3. Expression regulière sur les dates
    Par Konrad Florczak dans le forum Langage
    Réponses: 23
    Dernier message: 05/10/2006, 17h49
  4. expression régulière sur flux
    Par zais_ethael dans le forum Collection et Stream
    Réponses: 2
    Dernier message: 19/09/2006, 23h38
  5. Réponses: 4
    Dernier message: 25/07/2006, 17h37

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo