Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > ETL
ETL Le Forum d'entraide ETL (Extract Transform Load) et Datawarehouse : DataStage, SunOpsis, Data Integrator, Informatica, OWB, Data Manager, Talend Open Studio,...
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 29/05/2007, 10h29   #1
Membre du Club
 
Étudiant
Inscription : octobre 2006
Messages : 142
Détails du profil
Informations personnelles :
Âge : 26

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : octobre 2006
Messages : 142
Points : 44
Points : 44
Envoyer un message via MSN à caballero
Par défaut Datawarehouse, Datamarts : Quelle structure choisir ?

Voila, dans mon projet je dois mettre en place une solution ETL. Pour cela je pense utiliser le schémas suivant :

J'extrait de mes bases de données des informations que je met dans une base tampon. Dans cette base, je fais mes transformations (nettoyages, agregations, calculs nouveaux champs,...). Ensuite je souhaite utiliser un datawarehouse. J'ai alors vu que l'on pouvais utiliser un datawarehouse qui alimentait à son tour des datamarts. Ou alors, il était possible d'alimenter directement des datamarts.

J'ai pu lire que la différences était du au fait que l'on diminuait le nombre d'opérations. (si vous voulez un schéma je peut en faire un vite fait) Or en utilisant une base tampon. On remarque que le nombre d'opération reste inchangé. De ce fait, je voudrai savoir quels sont alors les avantages et inconvénients pour l'utilisation de l'une ou l'autre des solutions.

(J'espère avoir été clair )
caballero est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 29/05/2007, 18h02   #2
Nouveau Membre du Club
 
Inscription : mars 2007
Messages : 42
Détails du profil
Informations forums :
Inscription : mars 2007
Messages : 42
Points : 35
Points : 35
Bonjour,

En théorie, le DWH est plus détaillé que le datamart (DM). Un DM doit rester une vue d'une partie du DWH, voir une vue agrégée.

Par exemple:
Tu as un DWH détaillé par jour, par vendeur, par produit, .....
Tes utilisateurs n'ont principalement besoin que d'une vue hebdo par famille de produits. Tu vas créer un DM, qui te permettra de répondre à leurs besoins principaux, et qui sera beaucoup moins volumineux.
Et puis bien sûr, il se trouve qu'un jour, ces mêmes utilisateurs ont besoin du détail par jour et/ou par produits, alors ils pourront faire un focus sur le DWH.

Une autre raison, et c'est sans doute la principale, c'est que très très fréquemment un DWH est évéènementiel, c'est à dire qu'il contient l'ensemble de tous les évènements qui se sont produit (sur une commande par exemple).
Or hormis à des fins d'études ponctuels (type datamining par exemple), ou à des fins de comparatifs, l'évènementiel n'est pas utilisé. D'où le besoin de DM pour allèger les temps de réponse et la volumétrie.

J'espère t'avoir donné une orientation.

Thierry Babulle
tbabulle est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 30/05/2007, 08h57   #3
Membre du Club
 
Étudiant
Inscription : octobre 2006
Messages : 142
Détails du profil
Informations personnelles :
Âge : 26

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : octobre 2006
Messages : 142
Points : 44
Points : 44
Envoyer un message via MSN à caballero
ok ouais ça m'aide un peu. J'ai pu avoir quelques renseignement hier soir (sur un blog : lien)

Ton avis m'aide à en savoir encore un peu plus, merci

(j'ai transferé cette discussion dans le forum parent)
caballero est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 06h54.


 
 
 
 
Partenaires

Hébergement Web