Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > ETL
ETL Le Forum d'entraide ETL (Extract Transform Load) et Datawarehouse : DataStage, SunOpsis, Data Integrator, Informatica, OWB, Data Manager, Talend Open Studio,...
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 21/06/2007, 13h58   #1
Invité de passage
 
Inscription : juin 2007
Messages : 2
Détails du profil
Informations forums :
Inscription : juin 2007
Messages : 2
Points : 0
Points : 0
Par défaut Construction DWH et ETL libre (Talend, Kettle)

Bonjour,
je suis débutant dans le monde du DataWareHouse et j'ai quelques questions sur sa construction avec des outils libres tels que Kettle ou Talend O.S.:

Voila, j'ai fait une rapide modélisation de la partie qui m'interesse (cf fichier attaché) et je souhaiterais maintenant construire mon DW avec des outils libres tels que Talend ou Kettle.

Je voudrais savoir comment j'arrive à determiner l'identifiant de l'enregistremement de ma dimension correspondant à mon fait (ici typiquement, j'enregistre un fait communication par heure sur une destination et pour un poste donné) mais comment récupérer l'enregistrement correspondant à l'heure de la communication avec un des ETL cités ?

De plus, meme si j'ai dénormalisé certainement abusivement, pouvais vous me donnez des conseils sur cette modélisation ?

Merci beaucoup.
Images attachées
Type de fichier : png md.png (194,4 Ko, 39 affichages)
Yoann38 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 29/06/2007, 10h30   #2
Membre Expert
 
Avatar de nuke_y
 
Inscription : mai 2004
Messages : 1 812
Détails du profil
Informations forums :
Inscription : mai 2004
Messages : 1 812
Points : 1 609
Points : 1 609
Je ne comprend pas DateDebut et DateFin dans tes tables Services et Utilisateurs. Si ça sert à faire une historisation de type SCD (Slowly Changing Dimension) il manque les mêmes informations dans la table Postes. Sinon je ne vois pas à quoi ça sert.

Pour alimenter ça avec ton ETL il n'y a souvent qu'une manière de faire quand on débute :
- décrit tes flux (ce que tu veux faire, données sources/cibles, etc.)
- réalise tes alimentations en SQL pur (avec un SQL simple si possible) pour voir si tu y arrives.
- remplace ces alimentations en SQL pur par leur équivalent en ETL.
- puis améliore / optimise en utilisant ce que l'ETL met à ta disposition (table de lookup, fonctions avancées comme l'envoi d'email, etc.)

Evidemment il ne s'agit là que de conseils pour un débutant qui ne connaît pas bien l'outil. Un expert bâtirai tout de suite une architecture et une cinématique adaptée à son outil. Et encore, comme le dit le proverbe, "le génie c'est la simplicité" et utiliser une cinématique simple est un gage de maintenabilité accrue.
__________________
Il vaut mieux monopoliser son intelligence sur des bêtises que sa bêtise sur des choses intelligentes.

Mon combat pour les droits des consommateurs face aux abus des grandes marques.
nuke_y est déconnecté   Envoyer un message privé Réponse avec citation 10
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 03h13.


 
 
 
 
Partenaires

Hébergement Web