IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

kettle/PDI Discussion :

Lookup et Volumétrie


Sujet :

kettle/PDI

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Mars 2007
    Messages
    104
    Détails du profil
    Informations personnelles :
    Âge : 36
    Localisation : France

    Informations forums :
    Inscription : Mars 2007
    Messages : 104
    Points : 115
    Points
    115
    Par défaut Lookup et Volumétrie
    Bonjour,

    J'ai un fichier délimité en input avec 6 000 000 de lignes, et un fichier délimité en lookup avec 5 000 000 de lignes. En utilisant un Stream lookup, j'ai fort logiquement un problème de mémoire. En effet, si j'ai bien, compris, Kettle va lire en mémoire l'ensemble de la lookup avant de mapper.

    Pour remédier à ce problème, depuis sa version 2.4.0 de TOS, Talend permet d'utiliser le Store On Disk dans leur tMap. Cette feature permet de créer des fichiers temporaires sur disque.

    Connaissant un peu Datastage, cet outils passe forcément par un fichier de hash, donc pas de problème de mémoire, même si les performances sont ainsi moins bonnes.

    J'ai donc réussi à réaliser mes transformations sur Talend et Datastage avec 5 000 000 de lignes en lookup. J'aimerais savoir comment je pourrais faire de même avec Kettle.

    Merci d'avance.

  2. #2
    Membre confirmé
    Inscrit en
    Juin 2005
    Messages
    447
    Détails du profil
    Informations forums :
    Inscription : Juin 2005
    Messages : 447
    Points : 546
    Points
    546
    Par défaut
    Bonjour,

    L'étape ''Recherche dans flux'' travaille uniquement en mémoire!
    Pour ton exemple, utilises plutôt l'étape "Jointure comparaison lignes".
    Mais avant, il faut trier les flux suivants les champs de recherche.


    samatar

Discussions similaires

  1. Texture + LookUp Table + Shader + extensions
    Par exxos dans le forum OpenGL
    Réponses: 7
    Dernier message: 01/09/2005, 17h14
  2. [ADMIN] Archive log : estimation volumétrie
    Par Francis HENRY dans le forum Oracle
    Réponses: 8
    Dernier message: 13/05/2005, 11h50
  3. Champ lookup
    Par bluevelvet dans le forum Bases de données
    Réponses: 3
    Dernier message: 02/04/2004, 17h40
  4. Lookup de valeurs
    Par Sylvain James dans le forum XMLRAD
    Réponses: 4
    Dernier message: 26/09/2003, 13h47
  5. champ lookup sur querydataSet
    Par freinhar dans le forum JBuilder
    Réponses: 3
    Dernier message: 20/12/2002, 17h29

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo