Bonjour,
Je suis en informatique médicale et nous avons un projet qui consiste à identifier correctement les patients d'une base de donnée.
Dans ma table j'ai 5 champs : id, nom, prenom, sexe et date de naissance.
Dans notre sujet il nous est dit que les variables nom et date de naissance sont fiables par contre il peut y avoir des erreurs sur le prénom ou le sexe.
ex :
id nom prénom sexe date de naissance
5 DUGAT PAUL 1 1947-08-24
8 DUGAT POL 1 1947-08-24
Je voudrais pouvoir afficher les différentes lignes suspectées d'être des doublons.
Merci pour votre aide.
Partager