IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SQL Firebird Discussion :

Comparaison insensible à la casse et aux accents


Sujet :

SQL Firebird

  1. #1
    Membre actif

    Profil pro
    Inscrit en
    Juillet 2004
    Messages
    479
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2004
    Messages : 479
    Points : 267
    Points
    267
    Par défaut Comparaison insensible à la casse et aux accents
    Bonjour
    Je cherche à fusionner deux bases de données contenant des données patronymiques possiblement communes et dont les casses et accent peuvent être aléatoires. Je possède aussi la date de naissance ce qui élimine en très grande partie les cas d'homonymie.
    Il me semble qu'il existe un moyen d'associer des casses distinctes par la clause collate, mais les accents ?
    D'autre part les différents arguments des collate d'un DCS donné (ISO8859_1) se trouvent où ?
    NB : FB 2.1
    Merci

  2. #2
    Modérateur
    Avatar de escartefigue
    Homme Profil pro
    bourreau
    Inscrit en
    Mars 2010
    Messages
    10 134
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : bourreau
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2010
    Messages : 10 134
    Points : 38 557
    Points
    38 557
    Billets dans le blog
    9
    Par défaut
    Bonjour,

    Le choix de la collation influe non seulement sur la sensibilité à la casse (CS=casse sensitive ou CI=casse insensitive), mais aussi aux accents (AS et AI)
    Ne connaissant pas spécifiquement Firebird, je ne sais pas si le choix de collations est riche ou non, à voir dans la doc FB.

    Attention, selon le S.I. la date de naissance est plus ou moins fiabilisée. J'ai souvenir de S.I. dans lesquels la DDN avait été déduite du numéro de sécurité sociale, d'où un jour de naissance positionné à "01" faute de mieux.
    Attention aussi aux séparateurs sur les prénoms composés : "Jean-Pierre" vs "Jean Pierre" ou "Jean, Pierre" voire "Jean" seulement...

    L'un des critères les plus fiables pour les personnes physiques est le NIR (n° de sécu par exemple), mais toutes les personnes n'en ont pas (certains étrangers par exemple) et tous ne sont pas fiables.
    Pour fiabiliser le rapprochement, le mieux est de faire des essais successifs pour affiner les critères.

  3. #3
    Rédacteur/Modérateur

    Avatar de SergioMaster
    Homme Profil pro
    Développeur informatique retraité
    Inscrit en
    Janvier 2007
    Messages
    15 038
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 67
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Janvier 2007
    Messages : 15 038
    Points : 40 943
    Points
    40 943
    Billets dans le blog
    62
    Par défaut
    FB 2.1 est plutôt obsolète, mais on trouve encore de la documentation
    https://firebirdsql.org/refdocs/lang...collation.html
    https://firebirdsql.org/refdocs/lang...ollations.html celle qui est recherchée est certainement ISO8859_1 FR_FR_CI_AI (une chance déjà présente en 2.1 )

    un truc pas trop mal fait ici http://www.destructor.de/firebird/charsets.htm
    MVP Embarcadero
    Delphi installés : D3,D7,D2010,XE4,XE7,D10 (Rio, Sidney), D11 (Alexandria), D12 (Athènes)
    SGBD : Firebird 2.5, 3, SQLite
    générateurs États : FastReport, Rave, QuickReport
    OS : Window Vista, Windows 10, Windows 11, Ubuntu, Androïd

  4. #4
    Membre actif

    Profil pro
    Inscrit en
    Juillet 2004
    Messages
    479
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2004
    Messages : 479
    Points : 267
    Points
    267
    Par défaut
    Citation Envoyé par escartefigue Voir le message
    Bonjour,

    Le choix de la collation influe non seulement sur la sensibilité à la casse (CS=casse sensitive ou CI=casse insensitive), mais aussi aux accents (AS et AI)
    Ne connaissant pas spécifiquement Firebird, je ne sais pas si le choix de collations est riche ou non, à voir dans la doc FB.

    Attention, selon le S.I. la date de naissance est plus ou moins fiabilisée. J'ai souvenir de S.I. dans lesquels la DDN avait été déduite du numéro de sécurité sociale, d'où un jour de naissance positionné à "01" faute de mieux.
    Attention aussi aux séparateurs sur les prénoms composés : "Jean-Pierre" vs "Jean Pierre" ou "Jean, Pierre" voire "Jean" seulement...

    L'un des critères les plus fiables pour les personnes physiques est le NIR (n° de sécu par exemple), mais toutes les personnes n'en ont pas (certains étrangers par exemple) et tous ne sont pas fiables.
    Pour fiabiliser le rapprochement, le mieux est de faire des essais successifs pour affiner les critères.
    Merci. Oui en effet la recherche de doublon sur les patronymes n'est pas une science exacte la patronymie n'étant pas formelle.
    Pas de NIR dans la base, rien à tirer de ce côté et la date de naissance est un moyen pas fiable à 100% de limiter les faux doublons du genre Jean Dupont.

  5. #5
    Membre actif

    Profil pro
    Inscrit en
    Juillet 2004
    Messages
    479
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2004
    Messages : 479
    Points : 267
    Points
    267
    Par défaut
    Citation Envoyé par SergioMaster Voir le message
    FB 2.1 est plutôt obsolète, mais on trouve encore de la documentation
    https://firebirdsql.org/refdocs/lang...collation.html
    https://firebirdsql.org/refdocs/lang...ollations.html celle qui est recherchée est certainement ISO8859_1 FR_FR_CI_AI (une chance déjà présente en 2.1 )

    un truc pas trop mal fait ici http://www.destructor.de/firebird/charsets.htm
    Parfait SergioMaster, c'est ce que je cherchais. Merci.

  6. #6
    Modérateur
    Avatar de escartefigue
    Homme Profil pro
    bourreau
    Inscrit en
    Mars 2010
    Messages
    10 134
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : bourreau
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2010
    Messages : 10 134
    Points : 38 557
    Points
    38 557
    Billets dans le blog
    9
    Par défaut
    En ce cas, il est d'usage de remercier le contributeur en votant pour les réponses qui ont pu vous aider avec le bouton prévu pour

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Comparaison insensible à la casse ?
    Par ADK604 dans le forum Macros et VBA Excel
    Réponses: 5
    Dernier message: 05/02/2018, 11h34
  2. Comparaison insensible à la casse
    Par bizzzounours dans le forum Macros et VBA Excel
    Réponses: 2
    Dernier message: 09/10/2015, 10h35
  3. LIKE / insensible à la casse et aux accents
    Par Samish dans le forum Requêtes
    Réponses: 12
    Dernier message: 03/04/2009, 18h53
  4. Réponses: 7
    Dernier message: 26/07/2007, 11h33
  5. Recherche insensible à la casse ET insensible aux accents.
    Par Bernard Grosdoy dans le forum SQL Procédural
    Réponses: 1
    Dernier message: 10/07/2005, 03h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo