IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Alimentation Discussion :

Cas d'étude: Alimentation fichier plat pour un Dwh


Sujet :

Alimentation

  1. #1
    Membre à l'essai
    Inscrit en
    Mai 2006
    Messages
    26
    Détails du profil
    Informations forums :
    Inscription : Mai 2006
    Messages : 26
    Points : 23
    Points
    23
    Par défaut Cas d'étude: Alimentation fichier plat pour un Dwh
    Bonjour,

    étant encore novice sur l'alimentation des données dans un Datawarehouse, je me posais des questions concernant une application existante.

    Je gère une solution "sales" standard qui intègre des fichiers plats (des exports csv) avec des indicateurs de ventes et des axes d'analyses comme les clients, boutiques, date de vente, etc...

    Contexte: Une structure fixe et standard a été mise en place pour intégrer les données des différentes boutiques.

    Par contre, cela n'empeche pas que chaque boutique doit effectuer des opérations (manuel ou automatique) laborieuse avant l'envoie des données pour coller à la structure.

    Ca découle donc sur un nombre important d'erreurs lié à la création de ces export (une colonne en trop, un mauvais choix de séparateur, etc...)

    Donc j'aimerais connaitre votre avis sur ce genre de cas. Avez vous déjà tenté de mettre en place des solutions qui permettent de récupérer des données sans cette contrainte de "structure fixe ".

    Je voudrais (pour ne pas dire "Je rêve" ) une appli capable d'intégrer tout un tas de fichiers "vente" et de récupérer les données commune mais sous formes différentes.

    J'entend souvent parler de "données non-structurées". Existe-t-il des outils capables de répondre à ce genre de besoin sans pour autant développer une application purement spécifique?

    Merci d'avoir pris le temps de me lire!

  2. #2
    Modérateur
    Avatar de Waldar
    Homme Profil pro
    Customer Success Manager @Vertica
    Inscrit en
    Septembre 2008
    Messages
    8 452
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Customer Success Manager @Vertica
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2008
    Messages : 8 452
    Points : 17 820
    Points
    17 820
    Par défaut
    Le format XML est là pour ça.
    Attention toutefois, ça ne se conjugue pas très bien avec de la grosse volumétrie.

    Le plus propre c'est d'automatiser les extractions, comme ça plus de surprise.

  3. #3
    Membre à l'essai
    Inscrit en
    Mai 2006
    Messages
    26
    Détails du profil
    Informations forums :
    Inscription : Mai 2006
    Messages : 26
    Points : 23
    Points
    23
    Par défaut
    C'est justement là le problème, impossible d'automatiser les extractions.
    Trop d'acteurs et de niveaus de maturité différents entre les boutiques. (certaines ont un vrai SI d'autre des excels...)

    J'aimerai une gestion dynamique de la structure en fait. Exemple d'entête:
    le fichier 1: Client;date;vente
    le fichier 2: date,vente,client
    le fichier 3: "vente";"date";"client"

    Un ETL peut reconnaitre dynamiquement ce genre de structure ?

  4. #4
    Expert confirmé
    Avatar de doc malkovich
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2008
    Messages
    1 884
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence

    Informations forums :
    Inscription : Juillet 2008
    Messages : 1 884
    Points : 4 285
    Points
    4 285
    Billets dans le blog
    1
    Par défaut
    Question intéressante mais les ETL que je connais ne gèrent pas ce type de structure dynamique

    On pourra toujours te donner de bonnes raisons comme :
    - il est impératif de connaître la structure à l'avance, sinon c'est la porte ouverte aux erreurs ;
    - c'est impératif pour les métadonnées et le référentiel de l'ETL ;
    - il vaut mieux aider les clients à fournir des fichiers corrects ;
    - les mappings s'appuient sur la position des colonnes.

    C'est vrai que c'est dommage, l'entête ne sert à rien dans la majorité des cas.
    Peut-être l'occasion d'apporter ta pierre à l'édfice de la BI ?
    N'oubliez pas de cliquer sur lorsque votre problème est réglé !

  5. #5
    Membre éprouvé Avatar de Jester
    Inscrit en
    Septembre 2003
    Messages
    813
    Détails du profil
    Informations forums :
    Inscription : Septembre 2003
    Messages : 813
    Points : 1 058
    Points
    1 058
    Par défaut
    Pour l'exemple donné Kettle peut gérer de l'injection de meta-données (étape 1 le job détecte la structure via la première ligne puis étape 2 l'ETL en lui-même), mais ce n'est pas évident à manipuler.

    S'il y a une doc précise, la question se résume à savoir que faire des boulets, c'est un problème de gouvernance. La solution consiste généralement à looper un N+x commun qui reply all en mettant la pression.

    Laisser faire et mettre la gestion des problème de ton coté n'est pas une solution saine je pense. C'est peut-être la seule mais il faut essayer de l'éviter.

  6. #6
    Membre à l'essai
    Inscrit en
    Mai 2006
    Messages
    26
    Détails du profil
    Informations forums :
    Inscription : Mai 2006
    Messages : 26
    Points : 23
    Points
    23
    Par défaut
    Merci pour vos réponses.

    En terme business, je vais aller dans le sens de Jester. J'aime beaucoup l'idée d'un abonnement SSRS avec comme destinataire le responsable du fichier et le n+1 en copie.

    Pour lmon coté "geek", je vais m'informer sur Kettle

    Merci!

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. fichier plats pour stocker des couples login/pwd
    Par riadhhwajdii dans le forum Entrée/Sortie
    Réponses: 5
    Dernier message: 01/12/2009, 15h34
  2. Réponses: 2
    Dernier message: 23/04/2009, 18h43
  3. Réponses: 3
    Dernier message: 26/08/2008, 14h45
  4. [Oracle 9i] fichier bat pour alimentation de la base
    Par cilies38 dans le forum Windows
    Réponses: 4
    Dernier message: 28/02/2007, 13h15
  5. [Oracle 9i] fichier bat pour alimentation de la base
    Par cilies38 dans le forum Oracle
    Réponses: 4
    Dernier message: 28/02/2007, 12h54

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo