IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Contribuez Discussion :

Retour d'expérience sur Talend


Sujet :

Contribuez

  1. #21
    Membre éprouvé Avatar de Jester
    Inscrit en
    Septembre 2003
    Messages
    813
    Détails du profil
    Informations forums :
    Inscription : Septembre 2003
    Messages : 813
    Points : 1 058
    Points
    1 058
    Par défaut
    Citation Envoyé par MattCasters Voir le message
    Ca, mon ami, c'est Kettle :-)
    Notez qu'à aucun moment, j'ai dit si c'était une meilleure approche ou pas. De 1) j'ai pas assez de recul et de 2) je pense que la meilleure solution est hybride (comme souvent).

    Bon je télécharge Kettle et je vais tester un peu. Ca me permettra de comparer mes impressions sur les deux outils et de faire un choix en connaissance de cause.

  2. #22
    Membre régulier
    Profil pro
    Inscrit en
    Septembre 2005
    Messages
    74
    Détails du profil
    Informations personnelles :
    Âge : 50
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Septembre 2005
    Messages : 74
    Points : 70
    Points
    70
    Par défaut
    Bonjour,

    Ayant benchmarké les deux (Kettle et Talend) l'année dernière pour le compte d'un grand groupe d'hotellerie, Kettle a été choisi principalement pour ses performances en environnement Solaris / Oracle, pour la rapidité de sa prise en main et la richesse de la librairie de fonctions.
    La proximité et la disponibilité des leaders du projet (dont l'excellent Matt Casters) ont aussi compté dans la balance.
    Plus de 50 gigas ont été chargés en alimentation initiale (avec de lourdes transformations jusqu'à des pivots / unpivots) et approx 3 gigas de manière quotidienne, avant transformations et agrégation.
    Un feedback complet (qui date d'un an), est disponible ici : http://www.developpez.net/forums/sho...d.php?t=253349

    Bien entendu, les deux produits ont évolué et même si Kettle reste mon préféré à titre personnel, les dernières utilisations que j'ai pu faire de Talend démontrent un niveau de maturité important.

    Vincent Teyssier
    http://open-bi.blogspot.com

  3. #23
    Futur Membre du Club
    Profil pro
    Inscrit en
    Novembre 2007
    Messages
    7
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2007
    Messages : 7
    Points : 8
    Points
    8
    Par défaut
    Bonjour

    Mes collègues et moi même venons juste de terminer, pour un groupe hôtelier ,un gros projet avec Talend.

    Nous manipulons un peu moins de 100G quotidiennement !

    Nous ne sommes pas encore au niveau du peta octet, mais on ne peut pas dire que ce soit négligeable non plus ! (inutile de vous dire que les machines sont bien dimensionnées !).
    Nous utilise actuellement les modes ETL et ELT.

    Et justement nous avions évalué au début du projet (il y a quelque mois) Kettle également, mais nous avons finalement décidé de l'écarter pour des raisons d'ergonomie/performance.

    Comme quoi...

    Ceci étant dit nous avons peut-être fait nos tests de performances après vinzent, et compte tenu de l'extrême évolutivité de Talend cela explique peut-être que nous ne soyons pas arrivé au mêmes conclusions.

  4. #24
    Membre régulier

    Inscrit en
    Décembre 2002
    Messages
    49
    Détails du profil
    Informations forums :
    Inscription : Décembre 2002
    Messages : 49
    Points : 76
    Points
    76
    Par défaut
    en terme de retour d'expérience , je dirais juste
    - essayer d'évaluer les performances de votre script à toutes les étapes du dév pour ne pas être bloqué (les tMap sont très gourmand en particulier)
    - faites attention , la lecture/écriture des fichiers XML n'est pas encore aussi générique qu'on le voudrai, on ne peut boucler que sur une donnée pour lire/ecrire des données, ce qui peut être gênant dans des projets ou on génère des fichiers XML intermédiaire complexe

  5. #25
    Rédacteur
    Avatar de jsd03
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Août 2008
    Messages
    1 221
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information

    Informations forums :
    Inscription : Août 2008
    Messages : 1 221
    Points : 6 506
    Points
    6 506
    Par défaut
    Voici mon retour d'expérience :

    J'ai utilisé TIS en entreprise pour un gros projet. Je le dis tout de suite Talend Integration Suite n'est pas approprié pour un projet qui comprendra plus de 30 jobs et dont plusieurs personnes développent dessus.

    - la mise à jour du repository en mode MySQL est HYPER lent, heureusement qu'ils sont passés depuis peu à une mise à jour en mode SVN qui est plus rapide surtout lors d'un ajout/modification de variables de contexte.

    - la gestion des projets via une web application java est plutôt jolie.. mais jolie ne rime pas forcement avec éfficacité et je trouve qu'elle prend beaucoup trop de mémoire et de CPU.

    - la commandline et le jobserver pour générer et scheduler les scripts des jobs prennent également énormément de ressources et la mise en place des ces deux outils auraient pû être largement simplifié!

    - comme l'a dit une autre personne dans ce post, l'interface est plutôt simpa avec les objets qu'on dépose, par contre encore un point négatif, l'interface Eclipse ! très longue à charger et lourde sur un poste client.

    - savoir développer en JAVA est, je pense, obligatoire quand on souhaite développer un projet en java.

    En conclusion, n'utiliser la version TIS que pour un projet mineur et favoriser la version TOS (gratuite) pour des jobs de tous les jours.
    Google est ton ami mais ton voisin aussi

    Modérateur BI - Responsable Talend
    Mes tutoriels - FAQ Talend - FAQ SQL*Plus

    Avant toute chose : lire le mode d'emploi du forum et ses règles.
    Suivez @Developpez sur twitter !

  6. #26
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Février 2009
    Messages
    1
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2009
    Messages : 1
    Points : 1
    Points
    1
    Par défaut compétences pour faire le Talend
    hello

    je suis un petit nouveau dans la bande, voici ma question qui fera lieu de self made bizutage
    je suis intéressé pour apprendre un outil BI comme Talend avec vous
    Seulement voici mes compétences
    connaissances de base de Cognos Impromptu (pour avoir remplacé au pied levé un spécialiste de cet outil que j'aime bien par ailleurs)
    je n'ai jamais pratiqué du java ni du perl et je suis spécialiste Powerbuilder/VB/Sybase/Oracle/Access
    M'est-il quand même possible d'apprendre Talend ? Si oui est-ce la présence d'Eclipse est obligatoire sur le poste (le JDK sans doute)
    A plus et muchas gracias

  7. #27
    Membre du Club
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    38
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 38
    Points : 42
    Points
    42
    Par défaut
    Citation Envoyé par velvet_underground Voir le message
    hello

    je suis un petit nouveau dans la bande, voici ma question qui fera lieu de self made bizutage
    je suis intéressé pour apprendre un outil BI comme Talend avec vous
    Seulement voici mes compétences
    connaissances de base de Cognos Impromptu (pour avoir remplacé au pied levé un spécialiste de cet outil que j'aime bien par ailleurs)
    je n'ai jamais pratiqué du java ni du perl et je suis spécialiste Powerbuilder/VB/Sybase/Oracle/Access
    M'est-il quand même possible d'apprendre Talend ? Si oui est-ce la présence d'Eclipse est obligatoire sur le poste (le JDK sans doute)
    A plus et muchas gracias
    Bonjour,

    Eclipse n'est pas nécessaire sur le poste.
    La JDK oui pour le soft puis pour les projets en Java sinon ajouter Perl (mais l'installation n'est pas simple sous windows ...).

    La connaissance de Java ou Perl n'est pas un pré requis pour commencer. Cependant lors de transformation plus élaboré, cela devient vite nécessaire mais on apprend vite sur des choses simples ( concaténation, sous-chaine, conditions, casting des variables,...) et pour utilisation de paramètres et variables produite par les composants ou les contextes.

    Pas du tout programmeur de formation , j'ai acquis une certaine maitrise de l'outil en Java et je me suis même essayé à Perl.

    Jérémie

  8. #28
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Mai 2007
    Messages
    29
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2007
    Messages : 29
    Points : 33
    Points
    33
    Par défaut
    Bonjour jsd03,

    Déjà merci pour ce retour d'expérience. Même s'il n'est pas très positif sur Talend Integration Suite, il a le mérite de mettre en évidence certaines défaillances auxquelles nous (chez Talend) devons porter notre attention.

    Citation Envoyé par jsd03 Voir le message
    - la gestion des projets via une web application java est plutôt jolie.. mais jolie ne rime pas forcement avec éfficacité et je trouve qu'elle prend beaucoup trop de mémoire et de CPU.
    Tu évoques bien la nouvelle interface web sortie en 3.0 pour l'administrator ? Elle a été développée en utilisant GWT (Google Web Toolkit). La forte consommation mémoire, c'est côté client ou serveur ? quel ordre de grandeur ?

    Citation Envoyé par jsd03 Voir le message
    - la commandline et le jobserver pour générer et scheduler les scripts des jobs prennent également énormément de ressources et la mise en place des ces deux outils auraient pû être largement simplifié!
    Nous sommes preneur de conseils sur l'architecture. Toute idée est bonne à prendre !

    Citation Envoyé par jsd03 Voir le message
    En conclusion, n'utiliser la version TIS que pour un projet mineur et favoriser la version TOS (gratuite) pour des jobs de tous les jours.
    De toute évidence, ce n'est pas notre objectif chez Talend (réserver Talend Integration Suite à des projets mineurs), donc on va s'attacher à étudier les points négatifs que tu évoques.

  9. #29
    Rédacteur
    Avatar de jsd03
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Août 2008
    Messages
    1 221
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information

    Informations forums :
    Inscription : Août 2008
    Messages : 1 221
    Points : 6 506
    Points
    6 506
    Par défaut
    Tu évoques bien la nouvelle interface web sortie en 3.0 pour l'administrator ? Elle a été développée en utilisant GWT (Google Web Toolkit). La forte consommation mémoire, c'est côté client ou serveur ? quel ordre de grandeur ?
    Oui je parle de l'interface pour l'administrator. Il semble qu'elle prenne beaucoup de mémoire au lancement d'un job et pendant tout le suivit du job. Mais peut être que ça vient aussi plus du jobserver. En tout qu'à lors de l'exéction d'un job les procéssus Java grimpent à 100% de CPU et la mémoire et vite "mangé". D'ailleurs sur la mémoire plus on met de mémoire au serveur et plus java l'utilise et ne rend pas la mémoire ou très peu en fin de job.
    Google est ton ami mais ton voisin aussi

    Modérateur BI - Responsable Talend
    Mes tutoriels - FAQ Talend - FAQ SQL*Plus

    Avant toute chose : lire le mode d'emploi du forum et ses règles.
    Suivez @Developpez sur twitter !

  10. #30
    Membre du Club
    Inscrit en
    Février 2008
    Messages
    56
    Détails du profil
    Informations personnelles :
    Âge : 40

    Informations forums :
    Inscription : Février 2008
    Messages : 56
    Points : 51
    Points
    51
    Par défaut
    Bonjour,

    voilà mon retour,

    je développe depuis 2 ans maintenant dans le domaine de décisionnel BO et Open source .

    c'est la première fois que j'utilise TalenD, et je suis vraiment satisfait des résultats, c'est vrai que ça deviens un petit peu long quand je dépasse des trentain de jobs , mais en général c'est un très bon ETL.

    La force pour moi d'un ETL c'est dans la documentation,TalenD est très riche en documentation, tu peux si tu as de l'expérience dans un autre ETL,dans une journée être familiariser avec cet outil.

    la force aussi c'est dans l'interface graphique ,très bien fait,très organisé, surtout le modèle métier c'est très sympa

    sympa aussi je peux regarder la partit code java des composant c'est très très bien , une fois j'avais un problème et j'ai pas réussi à le résoudre que quand j'ai lu le code c'est super pratique.

    Ohh je voulais laisser tMap à la fin c'est un super magique composant, c'est vraiment quand tu découvre ce composant tu ne peux que l'utiliser dans tous tes jobs.

    voilà

    Cordialement,

    ------------------------------
    Ingénieur Informatique décisionnel
    BO , Pentaho,TalenD
    lauréat de l'ENSIAS-Maroc
    ------------------------------

  11. #31
    Membre à l'essai
    Inscrit en
    Juin 2008
    Messages
    16
    Détails du profil
    Informations forums :
    Inscription : Juin 2008
    Messages : 16
    Points : 14
    Points
    14
    Par défaut
    Je viens de faire une formation sur Talend, il est vrai que le produit est ergonomique et flexible, mais il est vrais aussi qu'il faut des connaissances dans le langage choisit pour déboguer. j'ai pu aussi tester les performances il s'avère que ce n'est pas adapté à la grande volumétrie (les données sont traités ligne par ligne).

  12. #32
    Membre éprouvé
    Homme Profil pro
    Architecte Décisionnel
    Inscrit en
    Février 2008
    Messages
    866
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Architecte Décisionnel

    Informations forums :
    Inscription : Février 2008
    Messages : 866
    Points : 1 260
    Points
    1 260
    Par défaut
    Citation Envoyé par SAM_92 Voir le message
    J'ai pu aussi tester les performances il s'avère que ce n'est pas adapté à la grande volumétrie (les données sont traités ligne par ligne).
    C'est un peu vite dit d'après moi.
    - D'abord voir ce qu'on appelle une grande volumétrie (Talend gère très bien des traitements sur plusieurs millions de lignes)
    - Tous les ETLs traitent les données ligne par ligne. Les ELTs font des traitements ensembliste du fait qu'ils utilisent les moteurs de base de donnée, mais au global je ne pense pas qu'on puisse dire qu'ils sont plus performants que les ETL.

    Ceci dit, je suis d'accord sur le fait qu'il faut maîtriser le language (java ou perl) pour pouvoir développer dans de bonnes conditions.

    Nicolas

  13. #33
    Membre du Club
    Profil pro
    Inscrit en
    Août 2008
    Messages
    57
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2008
    Messages : 57
    Points : 64
    Points
    64
    Par défaut
    Citation Envoyé par SAM_92 Voir le message
    Je viens de faire une formation sur Talend, il est vrai que le produit est ergonomique et flexible, mais il est vrais aussi qu'il faut des connaissances dans le langage choisit pour déboguer. j'ai pu aussi tester les performances il s'avère que ce n'est pas adapté à la grande volumétrie (les données sont traités ligne par ligne).
    Je rejoins Devnico sur la volumétrie

    Et Sam_92, ta formation Talend s'est elle bien passée? Je peux te demander à laquelle tu as participé?

    Merci!

  14. #34
    Rédacteur
    Avatar de jsd03
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Août 2008
    Messages
    1 221
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information

    Informations forums :
    Inscription : Août 2008
    Messages : 1 221
    Points : 6 506
    Points
    6 506
    Par défaut
    +1 pour la volumétrie et surtout si tu as une base Oracle (en même temps j'ai pas essayé sur une autre BDD)... j'ai fais un projet au début on utilisait Talend pour tout faire et maintenant on passe par du PL/SQL pour faire de l'insertion en masse... et du coup au lieu de mettre 12h pour un traitement (et oui on utilise des millions de lignes) on en met plus que 6...
    Google est ton ami mais ton voisin aussi

    Modérateur BI - Responsable Talend
    Mes tutoriels - FAQ Talend - FAQ SQL*Plus

    Avant toute chose : lire le mode d'emploi du forum et ses règles.
    Suivez @Developpez sur twitter !

  15. #35
    Membre éprouvé
    Homme Profil pro
    Architecte Décisionnel
    Inscrit en
    Février 2008
    Messages
    866
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Architecte Décisionnel

    Informations forums :
    Inscription : Février 2008
    Messages : 866
    Points : 1 260
    Points
    1 260
    Par défaut
    Citation Envoyé par jsd03 Voir le message
    J'ai fais un projet au début on utilisait Talend pour tout faire et maintenant on passe par du PL/SQL pour faire de l'insertion en masse... et du coup au lieu de mettre 12h pour un traitement (et oui on utilise des millions de lignes) on en met plus que 6...
    Est-ce que vous avez essayé les composants ELT de Talend ?
    Ils permettent de faire des traitements ensemblistes sans perdre les avantages d'un ETL.

    Parce qu'abandonner un ETL pour faire du PL/SQL, c'est un peu dommage quand même...

    Nicolas

  16. #36
    Rédacteur
    Avatar de jsd03
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Août 2008
    Messages
    1 221
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information

    Informations forums :
    Inscription : Août 2008
    Messages : 1 221
    Points : 6 506
    Points
    6 506
    Par défaut
    Oui mais après on gagne un temps considérable donc...
    Google est ton ami mais ton voisin aussi

    Modérateur BI - Responsable Talend
    Mes tutoriels - FAQ Talend - FAQ SQL*Plus

    Avant toute chose : lire le mode d'emploi du forum et ses règles.
    Suivez @Developpez sur twitter !

  17. #37
    Membre éprouvé
    Homme Profil pro
    Architecte Décisionnel
    Inscrit en
    Février 2008
    Messages
    866
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Architecte Décisionnel

    Informations forums :
    Inscription : Février 2008
    Messages : 866
    Points : 1 260
    Points
    1 260
    Par défaut
    Ce que je veux dire, c'est que si vous avez réussi à diviser votre temps d'alimentation par 2 en le recodant en PL/SQL, c'est qu'il était possible de faire quelque chose d'équivalent avec Talend.

  18. #38
    Rédacteur
    Avatar de jsd03
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Août 2008
    Messages
    1 221
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information

    Informations forums :
    Inscription : Août 2008
    Messages : 1 221
    Points : 6 506
    Points
    6 506
    Par défaut
    Ou pas . Mais c'est une autre discution Ne nous éloignons pas du droit chemin
    Google est ton ami mais ton voisin aussi

    Modérateur BI - Responsable Talend
    Mes tutoriels - FAQ Talend - FAQ SQL*Plus

    Avant toute chose : lire le mode d'emploi du forum et ses règles.
    Suivez @Developpez sur twitter !

  19. #39
    Futur Membre du Club
    Profil pro
    Inscrit en
    Mars 2009
    Messages
    5
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2009
    Messages : 5
    Points : 6
    Points
    6
    Par défaut
    jsd03 tu peux me dire si vous aviez utilisé les composants Bulk ou juste les composants output ?

  20. #40
    Rédacteur
    Avatar de jsd03
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    Août 2008
    Messages
    1 221
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information

    Informations forums :
    Inscription : Août 2008
    Messages : 1 221
    Points : 6 506
    Points
    6 506
    Par défaut
    On utilisait les composants output car on devait à la fois faire de l'instert, récupérer un id et faire un update derrière. Donc pas évident évident.

    Par contre autre chose étonnante : avec une entrée "Main" (BDD) avec 12 millions d'enregistrements et une jointure avec un fichier dans un tMap en faisant un "store on disk" (pour éviter les problèmes de mémoire) et en modifiant les paramètres de la JVM au moment de l'éxécution du job pour prendre 4Go de mémoire, le job plante car il y a trop de données à traiter... A parament il faudrait utiliser les composants ELT plutôt que t[BDD]... donc dans ce cas là pourquoi avec les composants t[BDD] qui ne supportent pas une grosse charge de données.
    Google est ton ami mais ton voisin aussi

    Modérateur BI - Responsable Talend
    Mes tutoriels - FAQ Talend - FAQ SQL*Plus

    Avant toute chose : lire le mode d'emploi du forum et ses règles.
    Suivez @Developpez sur twitter !

Discussions similaires

  1. Des retours d'expérience sur Gigaspaces ?
    Par Promeneur dans le forum Outils
    Réponses: 2
    Dernier message: 18/09/2009, 11h45
  2. Communiquez vos retours d'expérience sur Delphi .NET
    Par Laurent Dardenne dans le forum Delphi .NET
    Réponses: 11
    Dernier message: 12/08/2008, 15h46
  3. Vos retours d'expérience sur l'utilisation les SGBD Objet ?
    Par Kentin dans le forum Décisions SGBD
    Réponses: 17
    Dernier message: 15/09/2007, 08h23
  4. Retour d'expérience sur CSLA.Net ?
    Par Promeneur dans le forum Général Dotnet
    Réponses: 5
    Dernier message: 13/03/2007, 10h46
  5. Retour d'expérience sur DataBase Visual Architect?
    Par Promeneur dans le forum Autres
    Réponses: 4
    Dernier message: 24/01/2007, 11h37

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo