IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

 SGBD Discussion :

Regle de dedoublonnage


Sujet :

SGBD

  1. #1
    Membre éprouvé Avatar de shaun_the_sheep
    Homme Profil pro
    Chef de projet NTIC
    Inscrit en
    Octobre 2004
    Messages
    1 619
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Chef de projet NTIC
    Secteur : Enseignement

    Informations forums :
    Inscription : Octobre 2004
    Messages : 1 619
    Points : 996
    Points
    996
    Par défaut Regle de dedoublonnage
    Bonjour,

    Je travaille sur la reprise d'un gros fichier de contact d'entreprise. Ce fichier intégre des données tel que le nom de la societe , son adresse, le numero SIRET (pas toujours renseigné -> entreprise etrangere).

    Le fichier comporte de nombreux doublons sur les nom exemple type: SNCF, S.N.C.F , societe des chemin de fer francais ...... ou les adresses (societe X à l'adresse 3 boulevard / societe X à l'adresse 3bd)

    j'avoue ne pas trop savoir par quel bout commencer pour dedoublonner ce fichier. quelqu'un a t'il déjà été confronté à ce type de tache ?

    quelles régles puis je mettre en place pour dédoublonner ? des fonctions type soundex peuvent elles être utile ?

    Je vous remercie de votre aide

  2. #2
    Membre émérite

    Profil pro
    Inscrit en
    Mars 2005
    Messages
    1 683
    Détails du profil
    Informations personnelles :
    Âge : 41
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Mars 2005
    Messages : 1 683
    Points : 2 579
    Points
    2 579

  3. #3
    Membre éprouvé Avatar de shaun_the_sheep
    Homme Profil pro
    Chef de projet NTIC
    Inscrit en
    Octobre 2004
    Messages
    1 619
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Chef de projet NTIC
    Secteur : Enseignement

    Informations forums :
    Inscription : Octobre 2004
    Messages : 1 619
    Points : 996
    Points
    996
    Par défaut
    Bonjour,

    Merci pour cet article très intéressant. J'aimerai juste savoir si vous aviez pu mettre en oeuvre cet algorithme , si oui quel est son efficacité ? ce type d'algorithme est il très gourmand en ressource ?

    Merci

  4. #4
    Membre éprouvé Avatar de shaun_the_sheep
    Homme Profil pro
    Chef de projet NTIC
    Inscrit en
    Octobre 2004
    Messages
    1 619
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Chef de projet NTIC
    Secteur : Enseignement

    Informations forums :
    Inscription : Octobre 2004
    Messages : 1 619
    Points : 996
    Points
    996
    Par défaut
    Bonjour,

    Quelqu'un a t'il mis en application les algorithme suivant:
    inférence basique et Hamming ?

    Merci

  5. #5
    Rédacteur/Modérateur

    Avatar de Antoun
    Homme Profil pro
    Architecte décisionnel
    Inscrit en
    Octobre 2006
    Messages
    6 281
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Architecte décisionnel
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 6 281
    Points : 11 737
    Points
    11 737
    Par défaut
    Citation Envoyé par beegood Voir le message
    Bonjour,

    Merci pour cet article très intéressant. J'aimerai juste savoir si vous aviez pu mettre en oeuvre cet algorithme , si oui quel est son efficacité ? ce type d'algorithme est il très gourmand en ressource ?

    Merci
    Juste teste-le.
    Antoun
    Expert Essbase, BO, SQL

    La bible d'Essbase, 2ème édition

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. A LIRE AVANT DE POSTER (REGLES ET DOCUMENTATION)
    Par NoisetteProd dans le forum Bases de données
    Réponses: 1
    Dernier message: 18/04/2006, 17h07
  2. Merci de respecter les regles du forum
    Par hiko-seijuro dans le forum Visual C++
    Réponses: 2
    Dernier message: 17/11/2005, 12h48
  3. [PGS 7.4 - linux] regle de INSERT
    Par geoffrey_k dans le forum PostgreSQL
    Réponses: 1
    Dernier message: 13/07/2004, 13h29
  4. Regle de nommage des versions
    Par Jay dans le forum Windows
    Réponses: 5
    Dernier message: 24/11/2003, 09h26

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo