IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Alimentation Discussion :

Plusieurs même clients


Sujet :

Alimentation

  1. #1
    Membre régulier
    Homme Profil pro
    Auditeur informatique
    Inscrit en
    Février 2012
    Messages
    131
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Auditeur informatique

    Informations forums :
    Inscription : Février 2012
    Messages : 131
    Points : 107
    Points
    107
    Par défaut Plusieurs même clients
    Bonjour,

    Dans le DW actuel pour la dimension client, il y a plusieurs fois le même client mais ayant une référence différente (identifiant du système transactionel).
    Ca engendre des erreurs au niveau des chiffres et calculs.

    J'ai l'impression qu'il est difficile de résoudre ce problème.
    La 1er piste était de se baser sur le nom et prénom mais comme vous le savez, il est tout à fait possible d'avoir un même nom et prénom pour 2 personnes différentes. L'autre piste est l'adresse email mais elle n'est pas toujours encodé et une même personne peut avoir différentes adresses email. Il en va de même pour la date de naissance, elle n'est pas toujours encodée ou bien encodé une fois sur deux pour un même client.

    Comment peut-on améliorer la qualité des données ?

  2. #2
    Modérateur
    Avatar de Waldar
    Homme Profil pro
    Customer Success Manager @Vertica
    Inscrit en
    Septembre 2008
    Messages
    8 452
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Customer Success Manager @Vertica
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2008
    Messages : 8 452
    Points : 17 820
    Points
    17 820
    Par défaut
    Ça se fait en amont du DWH, avec la mise en place d'un process MDM qui ira réconcilier toutes ces informations dans un seul espace unique, et qui a aussi vocation à devenir source des applications tierces.

    C'est un process à la fois technique et humain.
    Technique car lorsqu'on a le même individu avec le même nom, le même prénom, le même mail et le même numéro de téléphone, on peut supposer que c'est la même personne.
    Humain car il faut bien arbitrer les cas non réconciliables automatiquement.

    Informatica notamment propose des outils de MDM que je ne connais pas mais dont j'ai eu de bons échos.

    Bon courage, c'est en effet la brique la plus complexe lorsqu'on alimente un DWH.

  3. #3
    Membre régulier
    Homme Profil pro
    Auditeur informatique
    Inscrit en
    Février 2012
    Messages
    131
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Auditeur informatique

    Informations forums :
    Inscription : Février 2012
    Messages : 131
    Points : 107
    Points
    107
    Par défaut
    Microsoft aussi propose des outils dans ce sens avec notamment leur DQS et MDS.
    C'est un processus long et complexe a montre en place. Il n'y a donc pas de solution miracle.

  4. #4
    Expert confirmé
    Avatar de doc malkovich
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2008
    Messages
    1 884
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence

    Informations forums :
    Inscription : Juillet 2008
    Messages : 1 884
    Points : 4 285
    Points
    4 285
    Billets dans le blog
    1
    Par défaut
    Hello,

    Il y a en effet les solutions de MDM ou de DQ/Data Quality.
    C'est un problème classique de dédoublonnage et c'est trop complexe pour être géré via un script maison.
    Pour avoir une idée, ici un tuto sur talend en utilisant un composant de data quality.

    Bon courage
    N'oubliez pas de cliquer sur lorsque votre problème est réglé !

  5. #5
    Membre régulier
    Homme Profil pro
    Auditeur informatique
    Inscrit en
    Février 2012
    Messages
    131
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Auditeur informatique

    Informations forums :
    Inscription : Février 2012
    Messages : 131
    Points : 107
    Points
    107
    Par défaut
    Merci, je vais jeter un coup d'oeil

Discussions similaires

  1. Réponses: 2
    Dernier message: 09/02/2012, 10h05
  2. Réponses: 6
    Dernier message: 22/11/2006, 11h24
  3. plusieurs commandes même client
    Par pierrot67 dans le forum Bases de données
    Réponses: 5
    Dernier message: 22/05/2006, 08h36
  4. [OC4J 9.0.2] plusieurs modules clients dans application.xml
    Par Mokhtar BEN MESSAOUD dans le forum Autres
    Réponses: 2
    Dernier message: 11/02/2005, 10h18
  5. comment gerer plusieurs connexions client/serveur
    Par naili dans le forum C++Builder
    Réponses: 3
    Dernier message: 14/08/2002, 16h58

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo