Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > ETL
ETL Le Forum d'entraide ETL (Extract Transform Load) et Datawarehouse : DataStage, SunOpsis, Data Integrator, Informatica, OWB, Data Manager, Talend Open Studio,...
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 02/08/2011, 02h39   #1
Invité de passage
 
Homme Francois
Étudiant
Inscription : juillet 2011
Messages : 4
Détails du profil
Informations personnelles :
Nom : Homme Francois
Localisation : Canada

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : juillet 2011
Messages : 4
Points : 1
Points : 1
Par défaut Gestion des erreurs - Talend - Comment faire ?

Bonjour,

Je débute dans la conception de jobs sous Talend et je me demandais quels composants devrais-je utiliser afin d'obtenir une meilleure idée des problèmes se produisant au niveau de mon ETL.
Essentiellement, je voudrais connaître seulement l'heure d'exécution, le nom du job, le nom du fichier traité, le statut (ex.: réussi ou échec), et p-ê le type d'erreur si applicable.

J'ai ainsi un job 'parent' qui orchestre l'exécution des jobs séquentiellement afin de charger les dimensions, puis ensuite les faits dans ma base de données.

Les jobs comportent pour la plupart un composant tfilelist en entrée qui va filtrer les fichiers correspondant à traiter, suivi de plusieurs tMap, puis se termine par un composant qui charge dans ma base de données.

Ainsi quels composants devrais-je privilégier afin de satisfaire le besoin décrit précédemment, et à quel endroit doive-t-il se trouver, au sein du job 'parent' au sein des jobs 'enfant'?

Je suis aussi ouvert à d'autres suggestions de votre part, ayant peu d'expérience, qui pourrait faire mieux que ce que j'ai décrit au niveau de mon besoin.
siapower est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/08/2011, 09h56   #2
Membre émérite
 
Homme Nicolas Saumande
Architecte Décisionnel
Inscription : février 2008
Messages : 693
Détails du profil
Informations personnelles :
Nom : Homme Nicolas Saumande
Âge : 36
Localisation : France, Haute Garonne (Midi Pyrénées)

Informations professionnelles :
Activité : Architecte Décisionnel

Informations forums :
Inscription : février 2008
Messages : 693
Points : 879
Points : 879
Bonjour,

Globalement, j'utilise le composant tStatCatcher dans chacun de mes jobs afin de récupérer les informations dont tu parles.
Tu peux ensuite envoyer ça dans un fichier ou dans une table.

Ensuite, je redirige les sorties standard et erreur de mes traitements dans 2 fichiers distincts. Cela permet d'avoir des logs d'exécution ainsi que les messages d'erreur en cas de plantage.

Nicolas
DevNico est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/08/2011, 14h00   #3
Invité de passage
 
Homme Francois
Étudiant
Inscription : juillet 2011
Messages : 4
Détails du profil
Informations personnelles :
Nom : Homme Francois
Localisation : Canada

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : juillet 2011
Messages : 4
Points : 1
Points : 1
Merci de ton aide Nico,

Dois-je utiliser le composant tStatCatcher à l'aide des déclencheurs 'On Subjob Ok', 'On Subjob error' et dois-je le connecter directement au dernier composant de mon job qui se trouve être celui qui charge les données dans ma base de données?
siapower est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/08/2011, 17h13   #4
Membre émérite
 
Homme Nicolas Saumande
Architecte Décisionnel
Inscription : février 2008
Messages : 693
Détails du profil
Informations personnelles :
Nom : Homme Nicolas Saumande
Âge : 36
Localisation : France, Haute Garonne (Midi Pyrénées)

Informations professionnelles :
Activité : Architecte Décisionnel

Informations forums :
Inscription : février 2008
Messages : 693
Points : 879
Points : 879
Non.
Le tStatCatcher doit être utilisé dans un sousjob complètement indépendant.
Il se déclenche 2 fois : en tout début de job, et en toute fin de job.
Il génère donc 2 lignes, une de début et une de fin.

Nicolas
DevNico est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 07/08/2011, 06h04   #5
Invité de passage
 
Homme Francois
Étudiant
Inscription : juillet 2011
Messages : 4
Détails du profil
Informations personnelles :
Nom : Homme Francois
Localisation : Canada

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : juillet 2011
Messages : 4
Points : 1
Points : 1
Cela fonctionne effectivement pour indiquer le début et la fin du job.
J'ai essayé le composant tlogcatcher qui me retourne les mêmes résultats que le tStatcatcher.

Je me demande ce que je dois ajouter afin d'avoir un statut pour chacun des fichiers traités par le tFilelist.
siapower est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 10h07.


 
 
 
 
Partenaires

Hébergement Web