IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Contribuez Discussion :

Retour d'expérience sur Talend


Sujet :

Contribuez

  1. #41
    Membre régulier
    Profil pro
    Inscrit en
    décembre 2007
    Messages
    93
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : décembre 2007
    Messages : 93
    Points : 110
    Points
    110
    Par défaut
    Salut,

    En fait il ne faut pas oublier d'activer le mode stream/cursor sur les tDBxxxInput. Chez moi ca passe sans problème sur des volumes correctes (20 m de lignes)
    Pas testé sur plus gros volume, mais en mode cursor/stream, il n'y a pas de raison d'être bloqué par la mémoire sur le flux main.

    boubsy

  2. #42
    Rédacteur
    Avatar de jsd03
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    août 2008
    Messages
    1 221
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information

    Informations forums :
    Inscription : août 2008
    Messages : 1 221
    Points : 6 506
    Points
    6 506
    Par défaut
    Le mode stream cursor ? "Use cursor" dans les options de l'onglet "Advanced settings" ? Dans ce cas là comment va se comporter le traitement ? Traiter les données 1000 par 1000 lignes (par défaut) ?
    Google est ton ami mais ton voisin aussi

    Modérateur BI - Responsable Talend
    Mes tutoriels - FAQ Talend - FAQ SQL*Plus

    Avant toute chose : lire le mode d'emploi du forum et ses règles.
    Suivez @Developpez sur twitter !

  3. #43
    Membre régulier
    Profil pro
    Inscrit en
    décembre 2007
    Messages
    93
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : décembre 2007
    Messages : 93
    Points : 110
    Points
    110
    Par défaut
    salut,

    Lorsque tu actives le mode Stream/cursor sur un tDBxxxInput sur un flux main, Talend va positionner un curseur par block de 1000 lignes par défaut qu'il va charger en mémoire, ensuite il passe aux 1000 suivante...
    C'est une fonctionnalité native des drivers JDBC. En oracle c'est le mode cursor, avec MySql c'est le stream. D'autre base (SqlServer) sont automatiquement en stream par default je crois.

    Le traitement se comporte normalement ;-)
    Tu ne vois pas qu'il lit par block de 1000, c'est transparent.

    C'est ce mode qui est utilisé en standard par les ETL de type flux que je connaisse (Datastage, informatica, Bodi).

    C'est d'ailleurs surprenant qu'ils ne l'activent pas par défaut, sans doute pour des questions de rétro-compatibilité car ce mode est apparu avec la version 2.3 de mémoire.

    Bref, cela te permet de lire des données d'une source quelque soit son volume en flux main. Si on utilise le store on disk du tMap, il est recommandé de l'activer aussi.

    J'avoue que je ne me pose plus la question et l'active toujours.

    boubsy

  4. #44
    Rédacteur
    Avatar de jsd03
    Homme Profil pro
    Conseil - Consultant en systèmes d'information
    Inscrit en
    août 2008
    Messages
    1 221
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Indre et Loire (Centre)

    Informations professionnelles :
    Activité : Conseil - Consultant en systèmes d'information

    Informations forums :
    Inscription : août 2008
    Messages : 1 221
    Points : 6 506
    Points
    6 506
    Par défaut
    Citation Envoyé par boubsy Voir le message
    C'est d'ailleurs surprenant qu'ils ne l'activent pas par défaut, sans doute pour des questions de rétro-compatibilité car ce mode est apparu avec la version 2.3 de mémoire
    Oui vraiment étonnant effectivement.

    Mais dû coup ça ne change pas la suite du traitement. Cette option permet juste de mettre en mémoire à la lecture de la base mais si ensuite j'ai un tMap et un tSortRow ou un tAggregate j'aurai le même problème de mémoire car il n'y a pas cette option sur les 2 composants que je viens de citer du coup même si j'arrive à passer le chargement des mes données dans le tMap la suite plantera quand même.
    Google est ton ami mais ton voisin aussi

    Modérateur BI - Responsable Talend
    Mes tutoriels - FAQ Talend - FAQ SQL*Plus

    Avant toute chose : lire le mode d'emploi du forum et ses règles.
    Suivez @Developpez sur twitter !

  5. #45
    Membre régulier
    Profil pro
    Inscrit en
    décembre 2007
    Messages
    93
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : décembre 2007
    Messages : 93
    Points : 110
    Points
    110
    Par défaut
    Pour info,

    J'ai testé le module MPx (massively Parralele Extenstion) et cela permet de faire des tris + aggregations quel que soit le volume.
    Ca utilise des composanst dédiés (tFileScaleSort/tFileScaleAggregate) qui utilisent un binaire compilé par plateforme, donc pas de limite mémoire / Java.

    MPx semble répartir la charge de tri/aggregation sur plusieurs processeurs et c'est plutôt rapide (en tout cas + que le sort GNU)

    boubsy

Discussions similaires

  1. Des retours d'expérience sur Gigaspaces ?
    Par Promeneur dans le forum Outils
    Réponses: 2
    Dernier message: 18/09/2009, 11h45
  2. Communiquez vos retours d'expérience sur Delphi .NET
    Par Laurent Dardenne dans le forum Delphi .NET
    Réponses: 11
    Dernier message: 12/08/2008, 15h46
  3. Vos retours d'expérience sur l'utilisation les SGBD Objet ?
    Par Kentin dans le forum Décisions SGBD
    Réponses: 17
    Dernier message: 15/09/2007, 08h23
  4. Retour d'expérience sur CSLA.Net ?
    Par Promeneur dans le forum Général Dotnet
    Réponses: 5
    Dernier message: 13/03/2007, 10h46
  5. Retour d'expérience sur DataBase Visual Architect?
    Par Promeneur dans le forum Autres
    Réponses: 4
    Dernier message: 24/01/2007, 11h37

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo