Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > ETL > Talend
Talend Forum d'entraide sur Talend (Talend Open Studio, ...). Avant de poster --> FAQ Talend, Tutoriels Talend
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 21/06/2011, 11h19   #1
Invité de passage
 
Homme
Analyste décisionnel
Inscription : juin 2011
Messages : 5
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France, Somme (Picardie)

Informations professionnelles :
Activité : Analyste décisionnel

Informations forums :
Inscription : juin 2011
Messages : 5
Points : 0
Points : 0
Par défaut Questions / Problèmes Talend

Bonjour,

Je débute dans Talend et j'ai plusieurs questions et problèmes :

- j'aimerai faire une jointure entre 2 tables issues de 2 bases de données différentes, le seul moyen que j'ai trouvé est de passer par un TJoin ou un TMap, mais une de mes 2 tables contient plusieurs millions d'enregistrements, et donc le job tourne presque infiniment... personne n'aurait un autre moyen ?

- j'ai plusieurs jobs qui ont besoin d'une date en context pour pouvoir filtrer des données, mais est-il possible dans le Talend Administration Center, de mettre - automatiquement - dans la variable de context la date du jour ?

- j'ai configuré mon projet afin qu'il stock les logs et erreurs dans une base de données, lorsque je lance un job depuis le studio les logs/erreurs sont bien alimentés mais par contre quand je lance un job depuis une task dans le T.A.C. les tables de logs/erreurs ne sont pas remplis :-(

- et dernier point, mon T.A.C. est très très instable, j'ai plusieurs fois par jour des "freezes" (toutes les catégories sont vides, puis quelques minutes après des "Error : servlet unreachable !! Check server log.", et dans les logs j'ai de nombreux "OutOfMemoryError: PermGen space" (logs tomcat & TAC)


Si vous avez des idées/conseils, je suis preneur

merci
Fichiers attachés
Type de fichier : zip logs.zip (10,2 Ko, 1 affichages)
jerome80 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 21/06/2011, 14h09   #2
Membre Expert
 
Avatar de Benoit_Durand
 
Benoit Durand
Consultant en Business Intelligence Freelance
Inscription : mars 2005
Messages : 812
Détails du profil
Informations personnelles :
Nom : Benoit Durand
Localisation : France, Gironde (Aquitaine)

Informations professionnelles :
Activité : Consultant en Business Intelligence Freelance

Informations forums :
Inscription : mars 2005
Messages : 812
Points : 1 084
Points : 1 084
Citation:
Envoyé par jerome80 Voir le message
Bonjour,

- j'aimerai faire une jointure entre 2 tables issues de 2 bases de données différentes, le seul moyen que j'ai trouvé est de passer par un TJoin ou un TMap, mais une de mes 2 tables contient plusieurs millions d'enregistrements, et donc le job tourne presque infiniment... personne n'aurait un autre moyen ?
Il est conseillé d'utiliser la plus grosse table dans le flux main et si c'est possible charger la table de référence en mémoire.
Sinon il est peut être possible de charger une des tables sur l'autre base puis de faire un inner join entre les 2 tables ...

Citation:
Envoyé par jerome80 Voir le message
- j'ai plusieurs jobs qui ont besoin d'une date en context pour pouvoir filtrer des données, mais est-il possible dans le Talend Administration Center, de mettre - automatiquement - dans la variable de context la date du jour ?
Il est facile de l'initialiser au début du job au pire.
__________________
Pensez à la fonction Recherche
Benoit_Durand est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 21/06/2011, 14h22   #3
Invité de passage
 
Homme
Analyste décisionnel
Inscription : juin 2011
Messages : 5
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France, Somme (Picardie)

Informations professionnelles :
Activité : Analyste décisionnel

Informations forums :
Inscription : juin 2011
Messages : 5
Points : 0
Points : 0
Citation:
Envoyé par Benoit_Durand Voir le message
Sinon il est peut être possible de charger une des tables sur l'autre base puis de faire un inner join entre les 2 tables ...
Je vais tenter ça, merci

Citation:
Envoyé par Benoit_Durand Voir le message
Il est facile de l'initialiser au début du job au pire.
Comment faites vous ça ?

merci
jerome80 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 21/06/2011, 15h08   #4
Membre Expert
 
Avatar de Benoit_Durand
 
Benoit Durand
Consultant en Business Intelligence Freelance
Inscription : mars 2005
Messages : 812
Détails du profil
Informations personnelles :
Nom : Benoit Durand
Localisation : France, Gironde (Aquitaine)

Informations professionnelles :
Activité : Consultant en Business Intelligence Freelance

Informations forums :
Inscription : mars 2005
Messages : 812
Points : 1 084
Points : 1 084
J'utilise généralement un tJavaFlex sinon pour une variable il doit être possible d'utiliser un tFixedFlowInput.

Pour le tJoin, quelle est la volumétrie des 2 tables ?
__________________
Pensez à la fonction Recherche
Benoit_Durand est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 21/06/2011, 15h33   #5
Invité de passage
 
Homme
Analyste décisionnel
Inscription : juin 2011
Messages : 5
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France, Somme (Picardie)

Informations professionnelles :
Activité : Analyste décisionnel

Informations forums :
Inscription : juin 2011
Messages : 5
Points : 0
Points : 0
Ok, je vais essayer avec le tFixedFlowInput

Au niveau volumétrie, environ 10 000 et environ 30 millions.


edit : avec le tFixedFlowInput je peux assigner une valeur, mais par contre, si après je veux changer la valeur de context depuis le TAC, celle-ci sera systématiquement ré-écrasé par le tFixedFlowInput..
jerome80 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/06/2011, 11h09   #6
Invité de passage
 
Homme
Analyste décisionnel
Inscription : juin 2011
Messages : 5
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France, Somme (Picardie)

Informations professionnelles :
Activité : Analyste décisionnel

Informations forums :
Inscription : juin 2011
Messages : 5
Points : 0
Points : 0
Bonjour,

J'ai résolu quelques un de mes problèmes, mais j'en ai toujours d'autres, si quelqu'un a des idées :

- Le TAC plante quasiment systématiquement quand je vais dans le "Jobs analyses" (logs d'exécutions des jobs)

- Impossible d'envoyer des notifications quand une tache plante, j'ai configurer la partie SMTP comme en pièce jointe (sachant qu'il n'y a pas besoin d'authentification..)

- Dès que je lance un job depuis le TAC, les propriétés de mon projet (notamment la sauvegarde des logs/stats dans la BDD) sont réinitialisées, et donc il n'y a pas de sauvegarde des logs...


merci
Images attachées
Type de fichier : png 2011-06-23_1059.png (21,7 Ko, 5 affichages)
jerome80 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/10/2011, 17h19   #7
Invité régulier
 
Inscription : avril 2004
Messages : 13
Détails du profil
Informations forums :
Inscription : avril 2004
Messages : 13
Points : 6
Points : 6
Par défaut Instabilité TAC

Bonjour

Avez vous pu résoudre vos problèmes d'instabilité du talend administrator?

Actuellement en 4.2 c'est une vraie galère pour l'utiliser de manière prédictive.

Les contextes ne sont pas toujours disponibles, la génération plante, le comportement diffère suivant que l'on a un job simple ou avec des sous-job.

Qu'il y ai des défauts en 4.0 c'est une chose mais en 4.2 ca devient pénible.
jpvigniel est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 19/10/2011, 10h39   #8
Membre Expert
 
Avatar de Benoit_Durand
 
Benoit Durand
Consultant en Business Intelligence Freelance
Inscription : mars 2005
Messages : 812
Détails du profil
Informations personnelles :
Nom : Benoit Durand
Localisation : France, Gironde (Aquitaine)

Informations professionnelles :
Activité : Consultant en Business Intelligence Freelance

Informations forums :
Inscription : mars 2005
Messages : 812
Points : 1 084
Points : 1 084
J'ai pas mal de mauvais retours sur TAC ces derniers temps.
Il faut s'assurer d'utiliser la dernière version 4.2.3 (c'est vite lourd de migrer à chaque fois) et ne pas hésiter à spammer le support payant, ils sont là pour ça.

J'ai notamment rencontré des problèmes de version de librairie Oracle et AS400 qui fonctionnait mal. Le truc bien lourd.
__________________
Pensez à la fonction Recherche
Benoit_Durand est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 25/10/2011, 14h55   #9
Invité régulier
 
Inscription : avril 2004
Messages : 13
Détails du profil
Informations forums :
Inscription : avril 2004
Messages : 13
Points : 6
Points : 6
Par défaut Passage en 4.2.3

Merci pour l'info, c'est de bien mauvaises nouvelles que voila, on vient de tout passer en 4.2.2.

J'espère avoir le support de vive voix demain, en attendant je vais arrêter de perdre mon temps a chercher les causes de mes problèmes tout seul.

Jean-Philippe
jpvigniel est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 28/10/2011, 15h16   #10
Membre du Club
 
Inscription : octobre 2009
Messages : 45
Détails du profil
Informations forums :
Inscription : octobre 2009
Messages : 45
Points : 46
Points : 46
Bonjour,

As tu eu des résolutions par rapport à tes soucis? Si tu peux contacter le support de l'éditeur, c'est la meilleure des solutions que tu puisses avoir. Ils sont les plus aptes à répondre à tes questions.

JBC
Jc-balt est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 28/10/2011, 15h58   #11
Membre Expert
 
Avatar de Benoit_Durand
 
Benoit Durand
Consultant en Business Intelligence Freelance
Inscription : mars 2005
Messages : 812
Détails du profil
Informations personnelles :
Nom : Benoit Durand
Localisation : France, Gironde (Aquitaine)

Informations professionnelles :
Activité : Consultant en Business Intelligence Freelance

Informations forums :
Inscription : mars 2005
Messages : 812
Points : 1 084
Points : 1 084
Pour TAC il ne faut pas oublier de préciser les paramètres de lancement de la JVM de Tomcat. Peut être que par défaut le heap size est trop faible et que la plateforme lache sur certaines opérations un peu lourde.
Talend conseille de mettre le heap size (-Xmx) de TAC à 1Go.
__________________
Pensez à la fonction Recherche
Benoit_Durand est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 01/11/2011, 10h27   #12
Invité régulier
 
Inscription : avril 2004
Messages : 13
Détails du profil
Informations forums :
Inscription : avril 2004
Messages : 13
Points : 6
Points : 6
J'ai eu le support (chinois et plutôt compétent).

Le principal point que je voulais traiter était la lenteur anormal d'affichage des contextes dans le TAC.
Ce cas arrive si on essaie de mettre en prod un job avec un acces fichier ou base.
Un contournement est possible en encapsulant ce job dans un autre mais c'est pas tres pratique.

La réponse est de passer en 4.2.3

Les problèmes de générations étaient dus à des disques pleins. C'est pas la première fois que des disques pleins nous posent de 'gros' soucis, il faut vraiment les surveiller de pres.

La je me bats avec la gestion des logs et leur affichage dans le TAC. Encore un truc avec un comportement 'probabiliste' des plus désagréable.

JP
jpvigniel est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 04/11/2011, 16h55   #13
Membre du Club
 
Inscription : octobre 2009
Messages : 45
Détails du profil
Informations forums :
Inscription : octobre 2009
Messages : 45
Points : 46
Points : 46
Bonjour,

Merci pour ton retour intéressant sur tes soucis et la résolution de tes problèmes.

JCB
Jc-balt est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 22h45.


 
 
 
 
Partenaires

Hébergement Web