IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SQL Firebird Discussion :

Comparaison insensible à la casse et aux accents


Sujet :

SQL Firebird

  1. #1
    Membre actif
    Profil pro
    Inscrit en
    juillet 2004
    Messages
    428
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : juillet 2004
    Messages : 428
    Points : 207
    Points
    207
    Par défaut Comparaison insensible à la casse et aux accents
    Bonjour
    Je cherche à fusionner deux bases de données contenant des données patronymiques possiblement communes et dont les casses et accent peuvent être aléatoires. Je possède aussi la date de naissance ce qui élimine en très grande partie les cas d'homonymie.
    Il me semble qu'il existe un moyen d'associer des casses distinctes par la clause collate, mais les accents ?
    D'autre part les différents arguments des collate d'un DCS donné (ISO8859_1) se trouvent où ?
    NB : FB 2.1
    Merci

  2. #2
    Modérateur
    Avatar de escartefigue
    Homme Profil pro
    bourreau
    Inscrit en
    mars 2010
    Messages
    8 754
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : bourreau
    Secteur : Finance

    Informations forums :
    Inscription : mars 2010
    Messages : 8 754
    Points : 32 213
    Points
    32 213
    Billets dans le blog
    3
    Par défaut
    Bonjour,

    Le choix de la collation influe non seulement sur la sensibilité à la casse (CS=casse sensitive ou CI=casse insensitive), mais aussi aux accents (AS et AI)
    Ne connaissant pas spécifiquement Firebird, je ne sais pas si le choix de collations est riche ou non, à voir dans la doc FB.

    Attention, selon le S.I. la date de naissance est plus ou moins fiabilisée. J'ai souvenir de S.I. dans lesquels la DDN avait été déduite du numéro de sécurité sociale, d'où un jour de naissance positionné à "01" faute de mieux.
    Attention aussi aux séparateurs sur les prénoms composés : "Jean-Pierre" vs "Jean Pierre" ou "Jean, Pierre" voire "Jean" seulement...

    L'un des critères les plus fiables pour les personnes physiques est le NIR (n° de sécu par exemple), mais toutes les personnes n'en ont pas (certains étrangers par exemple) et tous ne sont pas fiables.
    Pour fiabiliser le rapprochement, le mieux est de faire des essais successifs pour affiner les critères.

  3. #3
    Rédacteur/Modérateur

    Avatar de SergioMaster
    Homme Profil pro
    Développeur informatique
    Inscrit en
    janvier 2007
    Messages
    14 006
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 66
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Industrie

    Informations forums :
    Inscription : janvier 2007
    Messages : 14 006
    Points : 37 936
    Points
    37 936
    Billets dans le blog
    59
    Par défaut
    FB 2.1 est plutôt obsolète, mais on trouve encore de la documentation
    https://firebirdsql.org/refdocs/lang...collation.html
    https://firebirdsql.org/refdocs/lang...ollations.html celle qui est recherchée est certainement ISO8859_1 FR_FR_CI_AI (une chance déjà présente en 2.1 )

    un truc pas trop mal fait ici http://www.destructor.de/firebird/charsets.htm
    Delphi installés : D3,D7,D2010,XE4,XE7,D10 (Tokyo, Rio, Sidney) ,D11 (Alexandria)
    SGBD : Firebird 2.5, 3, SQLite
    générateurs Etats : FastReport, Rave, QuickReport
    OS : Window Vista, Windows 10, Ubuntu, Androïd

  4. #4
    Membre actif
    Profil pro
    Inscrit en
    juillet 2004
    Messages
    428
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : juillet 2004
    Messages : 428
    Points : 207
    Points
    207
    Par défaut
    Citation Envoyé par escartefigue Voir le message
    Bonjour,

    Le choix de la collation influe non seulement sur la sensibilité à la casse (CS=casse sensitive ou CI=casse insensitive), mais aussi aux accents (AS et AI)
    Ne connaissant pas spécifiquement Firebird, je ne sais pas si le choix de collations est riche ou non, à voir dans la doc FB.

    Attention, selon le S.I. la date de naissance est plus ou moins fiabilisée. J'ai souvenir de S.I. dans lesquels la DDN avait été déduite du numéro de sécurité sociale, d'où un jour de naissance positionné à "01" faute de mieux.
    Attention aussi aux séparateurs sur les prénoms composés : "Jean-Pierre" vs "Jean Pierre" ou "Jean, Pierre" voire "Jean" seulement...

    L'un des critères les plus fiables pour les personnes physiques est le NIR (n° de sécu par exemple), mais toutes les personnes n'en ont pas (certains étrangers par exemple) et tous ne sont pas fiables.
    Pour fiabiliser le rapprochement, le mieux est de faire des essais successifs pour affiner les critères.
    Merci. Oui en effet la recherche de doublon sur les patronymes n'est pas une science exacte la patronymie n'étant pas formelle.
    Pas de NIR dans la base, rien à tirer de ce côté et la date de naissance est un moyen pas fiable à 100% de limiter les faux doublons du genre Jean Dupont.

  5. #5
    Membre actif
    Profil pro
    Inscrit en
    juillet 2004
    Messages
    428
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : juillet 2004
    Messages : 428
    Points : 207
    Points
    207
    Par défaut
    Citation Envoyé par SergioMaster Voir le message
    FB 2.1 est plutôt obsolète, mais on trouve encore de la documentation
    https://firebirdsql.org/refdocs/lang...collation.html
    https://firebirdsql.org/refdocs/lang...ollations.html celle qui est recherchée est certainement ISO8859_1 FR_FR_CI_AI (une chance déjà présente en 2.1 )

    un truc pas trop mal fait ici http://www.destructor.de/firebird/charsets.htm
    Parfait SergioMaster, c'est ce que je cherchais. Merci.

  6. #6
    Modérateur
    Avatar de escartefigue
    Homme Profil pro
    bourreau
    Inscrit en
    mars 2010
    Messages
    8 754
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : bourreau
    Secteur : Finance

    Informations forums :
    Inscription : mars 2010
    Messages : 8 754
    Points : 32 213
    Points
    32 213
    Billets dans le blog
    3
    Par défaut
    En ce cas, il est d'usage de remercier le contributeur en votant pour les réponses qui ont pu vous aider avec le bouton prévu pour

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Comparaison insensible à la casse ?
    Par ADK604 dans le forum Macros et VBA Excel
    Réponses: 5
    Dernier message: 05/02/2018, 11h34
  2. Comparaison insensible à la casse
    Par bizzzounours dans le forum Macros et VBA Excel
    Réponses: 2
    Dernier message: 09/10/2015, 10h35
  3. LIKE / insensible à la casse et aux accents
    Par Samish dans le forum Requêtes
    Réponses: 12
    Dernier message: 03/04/2009, 18h53
  4. Réponses: 7
    Dernier message: 26/07/2007, 11h33
  5. Recherche insensible à la casse ET insensible aux accents.
    Par Bernard Grosdoy dans le forum SQL Procédural
    Réponses: 1
    Dernier message: 10/07/2005, 03h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo