Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > ETL
ETL Le Forum d'entraide ETL (Extract Transform Load) et Datawarehouse : DataStage, SunOpsis, Data Integrator, Informatica, OWB, Data Manager, Talend Open Studio,...
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 01/07/2008, 16h27   #1
Expert Confirmé Sénior
 
Avatar de _skip
 
Homme
Développeur d'applications
Inscription : novembre 2005
Messages : 2 326
Détails du profil
Informations personnelles :
Sexe : Homme
Âge : 28
Localisation : Suisse

Informations professionnelles :
Activité : Développeur d'applications
Secteur : High Tech - Produits et services télécom et Internet

Informations forums :
Inscription : novembre 2005
Messages : 2 326
Points : 4 798
Points : 4 798
Par défaut Talend - Automatisation

Bonjour,

Je tiens à utiliser Talend pour populer quotidiennement un schéma en étoile de façon incrémentale.
J'aurai déjà quelques premières questions à ce sujet :

-Il serait possible de faire des requêtes sur la base de production en utilisant la date du jour, mais ça me semble pas prudent... Comment fait-on dans les règles de l'art? Est-il judicieux de stocker dans la base de données la date de sa dernière importation?

-Dans la pratique, est-ce que toutes les opérations d'INSERT dans la base de destination devraient se faire au sein d'une même transaction?

-Quel mécanisme est à souhaiter pour la mise en place d'une gestion des erreurs? Envoyer un mail automatiquement à un responsable? Logger des informations?

-Finalement, pour du windows, quelles versions de Cron suggérez-vous?

Je sais ça fait beaucoup de question... J'aimerai juste être sûr que si je fais quelque chose je le fais bien.
_skip est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 01/07/2008, 17h06   #2
Membre Expert
 
Avatar de Benoit_Durand
 
Benoit Durand
Consultant en Business Intelligence Freelance
Inscription : mars 2005
Messages : 819
Détails du profil
Informations personnelles :
Nom : Benoit Durand
Localisation : France, Gironde (Aquitaine)

Informations professionnelles :
Activité : Consultant en Business Intelligence Freelance

Informations forums :
Inscription : mars 2005
Messages : 819
Points : 1 093
Points : 1 093
Citation:
Envoyé par _skip Voir le message
Bonjour,

Je tiens à utiliser Talend pour populer quotidiennement un schéma en étoile de façon incrémentale.
J'aurai déjà quelques premières questions à ce sujet :

-Il serait possible de faire des requêtes sur la base de production en utilisant la date du jour, mais ça me semble pas prudent... Comment fait-on dans les règles de l'art? Est-il judicieux de stocker dans la base de données la date de sa dernière importation?

-Dans la pratique, est-ce que toutes les opérations d'INSERT dans la base de destination devraient se faire au sein d'une même transaction?

-Quel mécanisme est à souhaiter pour la mise en place d'une gestion des erreurs? Envoyer un mail automatiquement à un responsable? Logger des informations?

-Finalement, pour du windows, quelles versions de Cron suggérez-vous?

Je sais ça fait beaucoup de question... J'aimerai juste être sûr que si je fais quelque chose je le fais bien.
1- stocker la date du dernier chargement dans une table est une pratique courante.

2- il vaut mieux en effet faire tous les insert d'un job dans une seule transaction, comme ça lors d'une erreur il n'y a eu aucun commit.

3- Prévenir l'exploitation avec un mail et garder un log des événements est conseillé

4- pour du windows personnellement j'utilisais le plannificateur des tâches

cordialement,
Benoit_Durand est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 01/07/2008, 17h16   #3
Expert Confirmé Sénior
 
Avatar de _skip
 
Homme
Développeur d'applications
Inscription : novembre 2005
Messages : 2 326
Détails du profil
Informations personnelles :
Sexe : Homme
Âge : 28
Localisation : Suisse

Informations professionnelles :
Activité : Développeur d'applications
Secteur : High Tech - Produits et services télécom et Internet

Informations forums :
Inscription : novembre 2005
Messages : 2 326
Points : 4 798
Points : 4 798
Merci, ça m'aide bien
_skip est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 03h35.


 
 
 
 
Partenaires

Hébergement Web