Précédent   Forum des professionnels en informatique > Bases de données > Décisions SGBD > Débuter
Débuter Forum d'entraide : Comment débuter en base de données ? Tutoriels SGBD
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 25/01/2008, 14h31   #1
Membre chevronné
 
Avatar de shaun_the_sheep
 
Homme
Chef de projet NTIC
Inscription : octobre 2004
Messages : 1 149
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France

Informations professionnelles :
Activité : Chef de projet NTIC
Secteur : Enseignement

Informations forums :
Inscription : octobre 2004
Messages : 1 149
Points : 605
Points : 605
Par défaut Regle de dedoublonnage

Bonjour,

Je travaille sur la reprise d'un gros fichier de contact d'entreprise. Ce fichier intégre des données tel que le nom de la societe , son adresse, le numero SIRET (pas toujours renseigné -> entreprise etrangere).

Le fichier comporte de nombreux doublons sur les nom exemple type: SNCF, S.N.C.F , societe des chemin de fer francais ...... ou les adresses (societe X à l'adresse 3 boulevard / societe X à l'adresse 3bd)

j'avoue ne pas trop savoir par quel bout commencer pour dedoublonner ce fichier. quelqu'un a t'il déjà été confronté à ce type de tache ?

quelles régles puis je mettre en place pour dédoublonner ? des fonctions type soundex peuvent elles être utile ?

Je vous remercie de votre aide
shaun_the_sheep est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 25/01/2008, 16h45   #2
Membre Expert
 
Inscription : mars 2005
Messages : 1 565
Détails du profil
Informations personnelles :
Âge : 29
Localisation : France, Haute Garonne (Midi Pyrénées)

Informations forums :
Inscription : mars 2005
Messages : 1 565
Points : 2 178
Points : 2 178
http://sqlpro.developpez.com/cours/s...aisons-motifs/
vmolines est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 28/01/2008, 08h46   #3
Membre chevronné
 
Avatar de shaun_the_sheep
 
Homme
Chef de projet NTIC
Inscription : octobre 2004
Messages : 1 149
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France

Informations professionnelles :
Activité : Chef de projet NTIC
Secteur : Enseignement

Informations forums :
Inscription : octobre 2004
Messages : 1 149
Points : 605
Points : 605
Bonjour,

Merci pour cet article très intéressant. J'aimerai juste savoir si vous aviez pu mettre en oeuvre cet algorithme , si oui quel est son efficacité ? ce type d'algorithme est il très gourmand en ressource ?

Merci
shaun_the_sheep est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 28/02/2008, 15h58   #4
Membre chevronné
 
Avatar de shaun_the_sheep
 
Homme
Chef de projet NTIC
Inscription : octobre 2004
Messages : 1 149
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France

Informations professionnelles :
Activité : Chef de projet NTIC
Secteur : Enseignement

Informations forums :
Inscription : octobre 2004
Messages : 1 149
Points : 605
Points : 605
Bonjour,

Quelqu'un a t'il mis en application les algorithme suivant:
inférence basique et Hamming ?

Merci
shaun_the_sheep est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 01/03/2008, 23h03   #5
Rédacteur/Modérateur

 
Avatar de Antoun
 
Homme Antoine Dinimant
Consultant en Business Intelligence
Inscription : octobre 2006
Messages : 5 854
Détails du profil
Informations personnelles :
Nom : Homme Antoine Dinimant
Âge : 42
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Consultant en Business Intelligence
Secteur : Conseil

Informations forums :
Inscription : octobre 2006
Messages : 5 854
Points : 9 540
Points : 9 540
Citation:
Envoyé par beegood Voir le message
Bonjour,

Merci pour cet article très intéressant. J'aimerai juste savoir si vous aviez pu mettre en oeuvre cet algorithme , si oui quel est son efficacité ? ce type d'algorithme est il très gourmand en ressource ?

Merci
Juste teste-le.
__________________
Antoun
Expert SQL, BO, Essbase

La bible d'Essbase est parue !
Antoun est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 07h19.


 
 
 
 
Partenaires

Hébergement Web