|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Membre chevronné
![]() Chef de projet NTIC Inscription : octobre 2004 Messages : 1 149 ![]() |
Bonjour,
Je travaille sur la reprise d'un gros fichier de contact d'entreprise. Ce fichier intégre des données tel que le nom de la societe , son adresse, le numero SIRET (pas toujours renseigné -> entreprise etrangere). Le fichier comporte de nombreux doublons sur les nom exemple type: SNCF, S.N.C.F , societe des chemin de fer francais ...... ou les adresses (societe X à l'adresse 3 boulevard / societe X à l'adresse 3bd) j'avoue ne pas trop savoir par quel bout commencer pour dedoublonner ce fichier. quelqu'un a t'il déjà été confronté à ce type de tache ? quelles régles puis je mettre en place pour dédoublonner ? des fonctions type soundex peuvent elles être utile ? Je vous remercie de votre aide |
|
|
00
|
|
|
#2 |
|
Membre Expert
![]() Inscription : mars 2005 Messages : 1 565 ![]() |
|
|
|
00
|
|
|
#3 |
|
Membre chevronné
![]() Chef de projet NTIC Inscription : octobre 2004 Messages : 1 149 ![]() |
Bonjour,
Merci pour cet article très intéressant. J'aimerai juste savoir si vous aviez pu mettre en oeuvre cet algorithme , si oui quel est son efficacité ? ce type d'algorithme est il très gourmand en ressource ? Merci |
|
|
00
|
|
|
#4 |
|
Membre chevronné
![]() Chef de projet NTIC Inscription : octobre 2004 Messages : 1 149 ![]() |
Bonjour,
Quelqu'un a t'il mis en application les algorithme suivant: inférence basique et Hamming ? Merci |
|
|
00
|
|
|
#5 |
![]() ![]() ![]() Antoine DinimantConsultant en Business Intelligence Inscription : octobre 2006 Messages : 5 854 ![]() |
Juste teste-le.
|
|
|
00
|
Copyright © 2000-2012 - www.developpez.com