IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Informatica Discussion :

Difference précise entre un Aggregator et un sorter


Sujet :

Informatica

  1. #1
    Membre du Club Avatar de Dodin
    Profil pro
    Inscrit en
    Avril 2009
    Messages
    104
    Détails du profil
    Informations personnelles :
    Âge : 38
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Avril 2009
    Messages : 104
    Points : 66
    Points
    66
    Par défaut Difference précise entre un Aggregator et un sorter
    Bonjour à tous,

    Je voudrais connaitre la différence exacte entre ces deux bloc. Apparemment l'aggregator à des fonctions plus poussés (MIN, MAX, COUNT...) que le sorter.
    Niveau performance ces deux transformations sont couteuses. Je trouve aussi qu'en rajoutant un sorter avant un aggregator et en cochant l'option sorted input les perf ne sont pas terribles.

    Dans quel cas préférer un sorter à un aggregator ?

    J'ai trouvé cela mais ce n'est pas très explicatif :

    Sorter uses the sorter Algorithm, but Aggrigator uses a
    physical Algorithm -(called CLUSTERED Algorithm)
    Sorter Aggregator
    ------- -----------
    1.Asc and Desc Only Asc order purpose
    order purpose
    2.Query is not Passible query is passible

    Merci pour vos réponses !

  2. #2
    Membre habitué
    Homme Profil pro
    consultant ETL
    Inscrit en
    Septembre 2008
    Messages
    97
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : consultant ETL
    Secteur : Conseil

    Informations forums :
    Inscription : Septembre 2008
    Messages : 97
    Points : 185
    Points
    185
    Par défaut
    ?

    un Sorter sert trier
    un AGG sert à aggreger, comme le group by dans une requete SQL
    Ce sont 2 objets différents qui ne font pas la meme chose, l'un nest pas une alternative a l'autre....

    on recommande de trier avant d'aggreger (avec l option Sorted input cochée comme le precise) pour amliorer les perf. j'aurais tendance à penser egalement qu il consomme moins de RAM pusqu'il n'est plus obligé de lire tout le flux avant de se mettre a aggreger.....

  3. #3
    Inactif  

    Homme Profil pro
    Freelance EURL / Business Intelligence ETL
    Inscrit en
    Avril 2005
    Messages
    5 879
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Freelance EURL / Business Intelligence ETL
    Secteur : Finance

    Informations forums :
    Inscription : Avril 2005
    Messages : 5 879
    Points : 26 147
    Points
    26 147
    Billets dans le blog
    3
    Par défaut
    Si ton entrée est de la base de données, tu peux faire en sorte de faire immédiatement un order by (selon version d'informatica, soit tu renseignes Number of sorted input en déplaçant, dans ton SQ, les champs à classer au début ; soit tu overrides la requête en plaçant un order by). Tu pourrais éviter de passer par un sorter qui peut consommer du cache.

    Si l'entrée est du fichier plat conséquent, il faudra sans doute utiliser un sorter.

    Tu brasses combien de lignes ? S'il y en a "peu", ça va peut-être pas le coup d'utiliser de faire un sorter, mais c'est bien de connaître cette astuce.
    - So.... what exactly is preventing us from doing this?
    - Geometry.
    - Just ignore it !!
    ****
    "The longer he lived, the more he realized that nothing was simple and little was true" A clash of Kings, George R. R. Martin.
    ***
    Quand arrivera l'apocalypse, il restera deux types d'entreprise : les pompes funèbres et les cabinets d'audit. - zecreator, 21/05/2019

  4. #4
    Membre du Club Avatar de Dodin
    Profil pro
    Inscrit en
    Avril 2009
    Messages
    104
    Détails du profil
    Informations personnelles :
    Âge : 38
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Avril 2009
    Messages : 104
    Points : 66
    Points
    66
    Par défaut
    Merci pour ta réponse !

    Je brasse entre 3 et 12 millions de lignes. Effectivement ton astuce peut-être avantageuse.


+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Débutant] Different comportement entre OleDb et SqlClient
    Par jloois dans le forum VB.NET
    Réponses: 13
    Dernier message: 04/09/2011, 20h00
  2. Réponses: 12
    Dernier message: 02/04/2011, 22h07
  3. Difference Fichier entrée sortie
    Par LP-mpascolo dans le forum Cobol
    Réponses: 3
    Dernier message: 31/03/2010, 17h01
  4. Difference shell entre Linux, HP-UX et SunOS
    Par ChrisMan dans le forum Shell et commandes GNU
    Réponses: 3
    Dernier message: 04/07/2008, 10h56
  5. Réponses: 0
    Dernier message: 03/08/2007, 17h59

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo