IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Alimentation Discussion :

Probléme liée au chargement des données dans le datawerhouse


Sujet :

Alimentation

  1. #1
    Candidat au Club
    Homme Profil pro
    Inscrit en
    Mai 2012
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Mai 2012
    Messages : 5
    Points : 3
    Points
    3
    Par défaut Probléme liée au chargement des données dans le datawerhouse
    Bonjour Tout le monde ,

    Est ce que quelqu’un pourra me citer des exemples de risques qui pourront se produire lors du chargement d'un datawerhouse

    Merci infiniment

  2. #2
    Expert confirmé
    Avatar de doc malkovich
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2008
    Messages
    1 884
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence

    Informations forums :
    Inscription : Juillet 2008
    Messages : 1 884
    Points : 4 285
    Points
    4 285
    Billets dans le blog
    1
    Par défaut
    Hum, un des risques importants est que le datawarehouse est trop lourd, dans ce cas là le serveur tombe et s'écrase au sol

    Plus sérieusement, pourriez-vous préciser le contexte, le sens de la question ?
    Donner des exemples, montrer que vous y avez réfléchi un peu ...
    N'oubliez pas de cliquer sur lorsque votre problème est réglé !

  3. #3
    Candidat au Club
    Homme Profil pro
    Inscrit en
    Mai 2012
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Mai 2012
    Messages : 5
    Points : 3
    Points
    3
    Par défaut
    Bonjour
    par exemple si j’alimente mon entropot de données à partir de 2 sources de données globale :
    base de données des douane et la base de données du ministère de l’agriculture

    pourtant j'ai pas fait attention que
    le code du produit blé dans la base de la douane est "XBLE" et le code du même produit dans la base du ministère de l’agriculture est "CDEBLE"
    donc je vais me retrouvé avec un produit qui a 2 code !!!!!!

    autre exemple
    prix d'un produit en différent devise

    ect


    j'espere que j'etais un peu claire


    Merci

  4. #4
    Modérateur
    Avatar de XxArchangexX
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Mars 2012
    Messages
    1 159
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Mars 2012
    Messages : 1 159
    Points : 2 323
    Points
    2 323
    Par défaut
    Bonjour,

    Du coup oui, il y a une infinité de problème possible. C'est pour cela que la première phase d'un entrepôt de données est la définition des règles de gestion.

    Comme tu dis, toutes les devises au même format, mais c'est pareil pour toutes les données. Il faut passer par une normalisation, nom de famille en majuscule? minuscule? première lettre majuscule et le reste minuscule? Les villes il faut un format sur le même principe. L'une des données les plus complexe, les dates format dd/MM/yyyy ou yyyy/MM/dd ou un autre. Tu as aussi les adresses, numéro,rue,ville, codepostale ou dans un autre ordre. Un dernier pour la route, la civilité peut être complexe aussi, calculé en fonction du prénom, c'est plus de l'enrichissement dans ce cas si les données sont calculées en fonction d'une autre.

    Du coup je ne sais pas quelle est la source pour tes données, mais si ça provient d'un formulaire rempli par des clients landa, il faut partir du principe qu'il peut y avoir tout et n'importe quoi.

    Il faut aussi faire attention au doublon. Et faire des fusions, mais c'est pareil c'est un point complexe car il faut éviter de fusionner des données qui sont vraiment différentes, pour illustrer, tu peux fusionner des clients par le nom prénom mais il existe des personnes avec le même nom et prénom. Rajouter l'adresse mais dans une famille il peut y avoir le même cas.

    Il faut donc définir le niveau de qualité de l'entrepôt, le nombre de doublon pour des analyses cohérentes et définir une règle de gestion pour chaque données. C'est pour cela qu'on dit qu'un entrepôt de données se construit et pas en 2 jours.

    Pour finir toutes ces opérations sont effectuées grâce à l'ETL, par le T pour transform .

    Après, c'est du temps et un coût mais c'est la prix à payer pour un entrepôt de qualité et des rapports d'analyse cohérent.
    L'Etat est bien administré quand l'escalier de l'école est usé et que l'herbe croît sur celui du tribunal.

    Modérateur BI

  5. #5
    Expert confirmé
    Avatar de doc malkovich
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2008
    Messages
    1 884
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence

    Informations forums :
    Inscription : Juillet 2008
    Messages : 1 884
    Points : 4 285
    Points
    4 285
    Billets dans le blog
    1
    Par défaut
    Comme le dit XxArchangexX il y a énormément de problèmes possibles
    Difficile de les lister ici, ça prendrait plusieurs pages ...

    Pour simplifier il y a principalement les problèmes de qualité de données (doublons, problèmes de saisie, références manquantes ou différentes ...). C'est pourquoi il faut une phase de nettoyage avant chargement dans le datawarehouse. Cette phase peut être faite en automatique dans les ETL mais il faut au préalable définir les règles qu'on veut vérifier.
    Et là il faut lister tous les contrôles possibles ...

    Bon courage
    N'oubliez pas de cliquer sur lorsque votre problème est réglé !

Discussions similaires

  1. Réponses: 7
    Dernier message: 16/02/2012, 11h47
  2. Réponses: 1
    Dernier message: 16/06/2010, 19h14
  3. [MySQL] chargement des données dans un formulaire
    Par super-java dans le forum PHP & Base de données
    Réponses: 4
    Dernier message: 22/04/2008, 12h49
  4. [C#] problème avec l'insertion des données dans MySQL
    Par madica dans le forum Accès aux données
    Réponses: 7
    Dernier message: 08/11/2005, 13h27

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo