IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Développement SQL Server Discussion :

reg-ex sur caractères accentués ne fonctionne pas comme voulu sur un select


Sujet :

Développement SQL Server

  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Octobre 2003
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2003
    Messages : 15
    Par défaut reg-ex sur caractères accentués ne fonctionne pas comme voulu sur un select
    bonjour,
    sur sqlserver 2014 et +, je tente de trouver par requête la liste des éléments qui ont autre chose que des caractères majuscule sans accents ou numérique. j'utilise un select trouvé sur le net mais il manque dans le résultat les éléments qui sont en minuscule et caractères accentué.
    pouvez vous me dire ce qui cloche ?

    SELECT * FROM @example WHERE code like '%[^A-Z0-9]%'
    ou
    SELECT * FROM @example WHERE code like '%#[^A-Z0-9]#%' (supposé dire Case sensitive explicite)
    ne fonctionnent pas


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    DECLARE @example TABLE
    (
        CODE VARCHAR(4) PRIMARY KEY
    )
    INSERT INTO @example  (code)
    VALUES (' 1'  ),(' J1' ),('?1'  ),('?2'  ),('?3'  ),('?4'  ),('?5'  ),('?8'  ),('?A1' ),('?C1' ),('?F1' ),
    ('?J1' ),('àT1' ),('%1' ),('BÉ3' ),('CÉ1' ),('ÀM1' ),('HÉ1' ),('MÉ1' ),('PÉ1' ),('SÉ1' ),('000P'),('000Q'),
    ('000R'),('000S'),('01a' ),('aa'  ),('AW'  ),('AAAA'),('000Y'),('0010'),('0012'),('0013'),('0015'),('0019'),
    ('001A'),('001D'),('001F'),('001G'),('001J'),('001K'),('001L'),('001O'),('001P'),('001Q'),('001S')
     
    SELECT * FROM @example WHERE code like '%[^A-Z0-9]%'

  2. #2
    Modérateur

    Profil pro
    dba
    Inscrit en
    Janvier 2010
    Messages
    5 643
    Détails du profil
    Informations personnelles :
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : dba

    Informations forums :
    Inscription : Janvier 2010
    Messages : 5 643
    Par défaut
    bonjour,

    Citation Envoyé par Yennick Voir le message
    SELECT * FROM @example WHERE code like '%#[^A-Z0-9]#%' (supposé dire Case sensitive explicite)

    Non, pour la sensitivité à la casse et aux accent, il faut spécifier le classement.

    essayez par exemple ceci :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    SELECT * FROM @example WHERE code like '%[^A-Z0-9]%' COLLATE FRENCH_CS_AS
    Si la casse a une importance pour le contenu de votre colonne, il est alors préférable de spécifier le classement directement pour la colonne en question (dans la définition de la table), voire au niveau de la base de données (classement par défaut)

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Octobre 2003
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2003
    Messages : 15
    Par défaut
    Bonjour et merci pour votre réponse qui fait avancer vers la solution

    Ce sont des données issues de très anciennes bases que l'on souhaite consolider (et recadrer en même temps)

    malheureusement cela ne fonctionne pas directement. En effet les caractères accentués semblent inclus dans A-Z ce qui fait que les codes tel que 'BÉ3' sont considérés comme bons.
    j'ai du écrire comme ceci.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    SELECT * FROM @example WHERE code like '%[^ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789]%' COLLATE FRENCH_CS_AS
    bien que fonctionnel je ne trouve pas ça très élégant

  4. #4
    Modérateur

    Profil pro
    dba
    Inscrit en
    Janvier 2010
    Messages
    5 643
    Détails du profil
    Informations personnelles :
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : dba

    Informations forums :
    Inscription : Janvier 2010
    Messages : 5 643
    Par défaut
    En effet, dans le classement FRENCH_CS_AS, le 'É' est classé entre le E, et le F, et donc a fortiori entre le A et le Z...
    Il en est d’ailleurs de même pour les minuscules, qui sont "mélangées" au majuscules (e est entre D et E).

    La solution que vous avez trouvée me semble bien, et a l'avantage d'être explicite.

    si vous voulez vraiment garder le principe des plages, alors il faudra un classement plus strict, je pense que ça pourrait fonctionner avec FRENCH_BIN

  5. #5
    Membre expérimenté
    Homme Profil pro
    Inscrit en
    Juin 2006
    Messages
    101
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Seine et Marne (Île de France)

    Informations forums :
    Inscription : Juin 2006
    Messages : 101
    Par défaut
    Très bon article sur les collations de SqlPro. (comme d'habitude d'ailleurs !!!)
    http://sqlpro.developpez.com/cours/s...er/collations/

  6. #6
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    22 001
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 22 001
    Billets dans le blog
    6
    Par défaut
    Mieux vaut utiliser cette formule :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    SELECT * 
    FROM   @example 
    WHERE  code NOT LIKE REPLICATE('[A-Z0-9]', LEN(code)) COLLATE French_CI_AS
    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  7. #7
    Membre expérimenté
    Homme Profil pro
    Inscrit en
    Juin 2006
    Messages
    101
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Seine et Marne (Île de France)

    Informations forums :
    Inscription : Juin 2006
    Messages : 101
    Par défaut
    Bonjour,

    SQLpro : pourquoi cette reformulation est-elle meilleure ?

  8. #8
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    22 001
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 22 001
    Billets dans le blog
    6
    Par défaut
    Parce que celle que l'on vous a donné sont fausses.

    Votre message initial :
    ... je tente de trouver par requête la liste des éléments qui ont autre chose que des caractères majuscule sans accents ou numérique ...
    Donc :
    ABCDÉFG --> doit sortir
    aBCDEFG --> doit sortir
    ABC-123 --> doit sortir
    ABCDEFG --> ne doit pas sortir
    ABC123 --> ne doit pas sortir

    Exemple :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    WITH T AS 
    (
    SELECT 'ABCDÉFG' AS DATA_TEST
    UNION ALL
    SELECT 'aBCDEFG'
    UNION ALL
    SELECT 'ABC-123'
    UNION ALL
    SELECT 'ABCDEFG'
    UNION ALL
    SELECT 'ABC123'
    )
    SELECT 'TEST SQLpro', *
    FROM   T
    WHERE  DATA_TEST COLLATE French_BIN NOT LIKE REPLICATE('[A-Z0-9]', LEN(DATA_TEST)) 
    UNION ALL
    SELECT 'TEST Yennick', *
    FROM   T
    WHERE  DATA_TEST like '%[^ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789]%' COLLATE FRENCH_CS_AS
    UNION ALL
    SELECT 'TEST aieeeuuuuu', *
    FROM   T
    WHERE  DATA_TEST like '%[^A-Z0-9]%' COLLATE FRENCH_CS_AS
    D'ailleurs la mienne aussi car il faut utiliser la collation French_BIN.... Je n'avais pas eu le temps de tester.

    D'autre part faites des tests de performance. Vous m'en direz la différence.

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  9. #9
    Modérateur

    Profil pro
    dba
    Inscrit en
    Janvier 2010
    Messages
    5 643
    Détails du profil
    Informations personnelles :
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : dba

    Informations forums :
    Inscription : Janvier 2010
    Messages : 5 643
    Par défaut
    C'est bien entendu plus rapide avec FRENCH_BIN (de l'ordre de trois fois plus rapide, mais comme les résultats ne sont pas les mêmes...)

    Pour ce qui est de la comparaison des trois solutions :

    jeu d'essai :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
     
    CREATE TABLE example 
    (
        CODE VARCHAR(4) 
    )
    INSERT INTO example  (code)
    VALUES (' 1'  ),(' J1' ),('?1'  ),('?2'  ),('?3'  ),('?4'  ),('?5'  ),('?8'  ),('?A1' ),('?C1' ),('?F1' ),
    ('?J1' ),('àT1' ),('%1' ),('BÉ3' ),('CÉ1' ),('ÀM1' ),('HÉ1' ),('MÉ1' ),('PÉ1' ),('SÉ1' ),('000P'),('000Q'),
    ('000R'),('000S'),('01a' ),('aa'  ),('AW'  ),('AAAA'),('000Y'),('0010'),('0012'),('0013'),('0015'),('0019'),
    ('001A'),('001D'),('001F'),('001G'),('001J'),('001K'),('001L'),('001O'),('001P'),('001Q'),('001S');
     
    INSERT INTO example
        SELECT TOP(10000000) CODE
        FROM example AS e, sys.objects AS o, sys.objects AS o2, sys.objects AS o3
    Solution SQLPro
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    SELECT count(*) FROM   example WHERE  code COLLATE French_BIN NOT LIKE REPLICATE('[A-Z0-9]', LEN(code))
    Temps UC = 4540*ms, temps écoulé = 4694*ms.
    Solution Aieeeuuuuu :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    SELECT COUNT(*) FROM example WHERE code LIKE '%[^A-Z0-9]%' COLLATE FRENCH_BIN
    Temps UC = 3885*ms, temps écoulé = 4165*ms
    solution TEST Yennick :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    SELECT COUNT(*) FROM example WHERE code like '%[^ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789]%' COLLATE FRENCH_BIN
    Temps UC = 9328*ms, temps écoulé = 9657*ms.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. programme qui ne fonctionne pas comme voulu
    Par flo68190 dans le forum Général Python
    Réponses: 6
    Dernier message: 13/12/2016, 00h17
  2. [Lazarus] Le remplacement de caractères accentués ne fonctionne pas
    Par [ZiP] dans le forum Lazarus
    Réponses: 9
    Dernier message: 13/08/2014, 21h44
  3. Réponses: 0
    Dernier message: 02/05/2012, 15h12
  4. requête sur caractères accentués
    Par csszzen dans le forum Langage SQL
    Réponses: 2
    Dernier message: 13/03/2007, 09h15
  5. Un Hint sur un PopupMenu ne fonctionne pas !!??
    Par momox dans le forum C++Builder
    Réponses: 6
    Dernier message: 26/05/2003, 16h48

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo