Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > ETL
ETL Le Forum d'entraide ETL (Extract Transform Load) et Datawarehouse : DataStage, SunOpsis, Data Integrator, Informatica, OWB, Data Manager, Talend Open Studio,...
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 23/10/2011, 19h17   #1
Invité de passage
 
Inscription : août 2008
Messages : 7
Détails du profil
Informations forums :
Inscription : août 2008
Messages : 7
Points : 0
Points : 0
Par défaut ETL où est il installer?

Bonsoir,
je dois faire un exposé sur le ETL dans le cadre de mon cours de système d'information et je bloque sur un point. (Ça doit être assez général.)
Où est installé le logiciel ETL? ou se fait la transformation?

Le logiciel est installé sur les postes, bdd sources et aussi dans la datawarehouse? ou uniquement sur l'un? (et dans ce cas à quel moment et sur quel poste se fait la transformation )
ou sur un poste spécifique dédié à l'ETL (si c'est ce cas c'est un ordinateur ou quelque chose de plus spécifique)?

Merci d'avance pour votre aide.
(Je ne voudrais pas paraitre impolie mais je suis assez pressée.)
Hailey est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 24/10/2011, 12h19   #2
Membre Expert
 
Avatar de Glutinus
 
Homme
Consultant en Business Intelligence
Inscription : avril 2005
Messages : 679
Détails du profil
Informations personnelles :
Sexe : Homme
Âge : 28
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Consultant en Business Intelligence
Secteur : Finance

Informations forums :
Inscription : avril 2005
Messages : 679
Points : 1 471
Points : 1 471
Tu mélanges effectivement un peu tout.

ETL c'est plus une logique, et effectivement une suite logicielle.
Très souvent sont installés sur des postes de développeur la partie qui permet de développer. Pour prendre l'exemple d'Informatica (que je connais le mieux), tu as le Designer PowerCenter pour "développer", le workflow manager pour créer le workflow, le workflow manager pour surveiller.

Le moteur ETL quant à lui tourne à 99% du temps sur un serveur qui lui est dédié. Ce serveur n'est pas (ou alors c'est une mauvaise architecture) le serveur où se trouve la base de données, ce que tu appelles le DWH.

Donc pour résumer :

N postes dédiés aux bases de données.
N postes (souvent 1) dédié à l'ETL.
N postes dédiés au développement des flux.

C'est l'architecture la plus simple et la plus connue ; maintenant pour des raisons de coûts, si tu veux faire des calculs pour un petit magasin et non une banque immense, tu peux imaginer qu'il y a un seul poste qui va gérer tout ça.
__________________

Dogbert : Here's my final report on your company. I've concluded you're doomed. You waste too much money on consultants.
Boss : You're a consultant.
Dogbert : Ironic, isn't it ?
~~
La culture, c'est comme la confiture : quand on l'aime, on la partage.
Amateur de photos et de groupes de rock qui gagnent à être connus ? Clique WWW !
Glutinus est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 24/10/2011, 13h29   #3
Modérateur
 
Avatar de doc malkovich
 
Homme
Consultant en Business Intelligence
Inscription : juillet 2008
Messages : 951
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France, Nord (Nord Pas de Calais)

Informations professionnelles :
Activité : Consultant en Business Intelligence

Informations forums :
Inscription : juillet 2008
Messages : 951
Points : 1 470
Points : 1 470
Bon résumé mais ...
Citation:
Envoyé par Glutinus Voir le message
Le moteur ETL quant à lui tourne à 99% du temps sur un serveur qui lui est dédié. Ce serveur n'est pas (ou alors c'est une mauvaise architecture) le serveur où se trouve la base de données, ce que tu appelles le DWH.
Oups. A ce que j'ai pratiqué, la plupart du temps le moteur ETL était sur le serveur du SGBD, architecture préconisée par l'éditeur pour éviter les flux réseau importants

Remarques :
  1. en mode ELT la transformation se fait directement dans le SGBD.
  2. ça dépend aussi des environnements, par exemple en dev tu peux avoir un moteur ETL sur le client de dev ( odi ).
__________________
Avez-vous 60 secondes pour répondre aux sondages sur BO ici et ?
doc malkovich est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 24/10/2011, 17h22   #4
Membre Expert
 
Avatar de Glutinus
 
Homme
Consultant en Business Intelligence
Inscription : avril 2005
Messages : 679
Détails du profil
Informations personnelles :
Sexe : Homme
Âge : 28
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Consultant en Business Intelligence
Secteur : Finance

Informations forums :
Inscription : avril 2005
Messages : 679
Points : 1 471
Points : 1 471
Citation:
Envoyé par doc malkovich Voir le message
Bon résumé mais ...

Oups. A ce que j'ai pratiqué, la plupart du temps le moteur ETL était sur le serveur du SGBD, architecture préconisée par l'éditeur pour éviter les flux réseau importants

Remarques :
  1. en mode ELT la transformation se fait directement dans le SGBD.
  2. ça dépend aussi des environnements, par exemple en dev tu peux avoir un moteur ETL sur le client de dev ( odi ).
J'essaie de me souvenir et tu me refiles un doute affreux. Il est possible effectivement qu'on ait des architectures qui soient alors sur la même machine.
__________________

Dogbert : Here's my final report on your company. I've concluded you're doomed. You waste too much money on consultants.
Boss : You're a consultant.
Dogbert : Ironic, isn't it ?
~~
La culture, c'est comme la confiture : quand on l'aime, on la partage.
Amateur de photos et de groupes de rock qui gagnent à être connus ? Clique WWW !
Glutinus est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 24/10/2011, 17h39   #5
Invité de passage
 
Inscription : août 2008
Messages : 7
Détails du profil
Informations forums :
Inscription : août 2008
Messages : 7
Points : 0
Points : 0
merci beaucoup pour vos réponses, c'est beaucoup plus claire.

Mais j'ai encore une question.
Si j'ai bien compris, les sociétés comme talend et informatica font des logiciels ETL mais c'est au entreprise de les développer/personnaliser en fonction de leur besoin? Le produit de base acheté à l'éditeur est la même pour tous?
Hailey est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 24/10/2011, 17h40   #6
Invité de passage
 
Inscription : août 2008
Messages : 7
Détails du profil
Informations forums :
Inscription : août 2008
Messages : 7
Points : 0
Points : 0
Citation:
Envoyé par Glutinus Voir le message
J'essaie de me souvenir et tu me refiles un doute affreux. Il est possible effectivement qu'on ait des architectures qui soient alors sur la même machine.

dans ce cas où se trouve la SGBD?
Hailey est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 25/10/2011, 16h16   #7
Modérateur
 
Avatar de doc malkovich
 
Homme
Consultant en Business Intelligence
Inscription : juillet 2008
Messages : 951
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France, Nord (Nord Pas de Calais)

Informations professionnelles :
Activité : Consultant en Business Intelligence

Informations forums :
Inscription : juillet 2008
Messages : 951
Points : 1 470
Points : 1 470
Citation:
Envoyé par Hailey Voir le message
Si j'ai bien compris, les sociétés comme talend et informatica font des logiciels ETL mais c'est au entreprise de les développer/personnaliser en fonction de leur besoin? Le produit de base acheté à l'éditeur est la même pour tous?
Oui, à part que généralement tu as différentes options et modules en fonction de ta licence. C'est un peu comme quand tu achètes une voiture, tu as différents niveaux d'équipement et les options à la carte.
Mais tu ne redéveloppes pas le produit, tu fais juste des traitements d'alimentation avec ( ta question n'est pas claire sur ce point )

Citation:
Envoyé par Hailey Voir le message
dans ce cas où se trouve la SGBD?
Sur un serveur ?
Dans le cas général tu as un seul SGBD pour le Datawarehouse, hébergé sur un seul serveur.
__________________
Avez-vous 60 secondes pour répondre aux sondages sur BO ici et ?
doc malkovich est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 10/11/2011, 16h27   #8
Membre du Club
 
Inscription : octobre 2009
Messages : 45
Détails du profil
Informations forums :
Inscription : octobre 2009
Messages : 45
Points : 46
Points : 46
Citation:
Envoyé par Hailey Voir le message
merci beaucoup pour vos réponses, c'est beaucoup plus claire.

Mais j'ai encore une question.
Si j'ai bien compris, les sociétés comme talend et informatica font des logiciels ETL mais c'est au entreprise de les développer/personnaliser en fonction de leur besoin? Le produit de base acheté à l'éditeur est la même pour tous?
Citation:
Envoyé par doc malkovich Voir le message
Oui, à part que généralement tu as différentes options et modules en fonction de ta licence. C'est un peu comme quand tu achètes une voiture, tu as différents niveaux d'équipement et les options à la carte.
Mais tu ne redéveloppes pas le produit, tu fais juste des traitements d'alimentation avec ( ta question n'est pas claire sur ce point )
Chez les éditeurs, tu auras le choix entre plusieurs versions: version de base, version moyen et haut de gamme. La licence reflète en effet cet aspect là. En plus, tu auras différents modules, options, etc qui seront aussi pris en compte dans ta licence.
Plus spécifiquement, chez les éditeurs Open Source, les entreprises peuvent personnaliser le logiciel en créant des composants, souvent redistribué à la communauté. Si les entreprises trouvent des bugs, ils en font part à l'éditeur open source, qui le corrigera. Et rendra le produit encore plus attrayant pour l'entreprise et la Communauté.
Jc-balt est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 11h42.


 
 
 
 
Partenaires

Hébergement Web