Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > ETL > Informatica
Informatica Forum d'entraide Informatica (PowerCenter, PowerExchange, Complex Data Exchange, etc.)
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 25/05/2011, 15h12   #1
Nouveau Membre du Club
 
Avatar de Dodin
 
Inscription : avril 2009
Messages : 102
Détails du profil
Informations personnelles :
Âge : 26
Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

Informations forums :
Inscription : avril 2009
Messages : 102
Points : 37
Points : 37
Par défaut Difference précise entre un Aggregator et un sorter

Bonjour à tous,

Je voudrais connaitre la différence exacte entre ces deux bloc. Apparemment l'aggregator à des fonctions plus poussés (MIN, MAX, COUNT...) que le sorter.
Niveau performance ces deux transformations sont couteuses. Je trouve aussi qu'en rajoutant un sorter avant un aggregator et en cochant l'option sorted input les perf ne sont pas terribles.

Dans quel cas préférer un sorter à un aggregator ?

J'ai trouvé cela mais ce n'est pas très explicatif :

Citation:
Sorter uses the sorter Algorithm, but Aggrigator uses a
physical Algorithm -(called CLUSTERED Algorithm)
Citation:
Sorter Aggregator
------- -----------
1.Asc and Desc Only Asc order purpose
order purpose
2.Query is not Passible query is passible

Merci pour vos réponses !
Dodin est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 26/05/2011, 14h07   #2
Membre du Club
 
Inscription : septembre 2008
Messages : 37
Détails du profil
Informations personnelles :
Âge : 38
Localisation : France, Paris (Île de France)

Informations forums :
Inscription : septembre 2008
Messages : 37
Points : 47
Points : 47
?

un Sorter sert trier
un AGG sert à aggreger, comme le group by dans une requete SQL
Ce sont 2 objets différents qui ne font pas la meme chose, l'un nest pas une alternative a l'autre....

on recommande de trier avant d'aggreger (avec l option Sorted input cochée comme le precise) pour amliorer les perf. j'aurais tendance à penser egalement qu il consomme moins de RAM pusqu'il n'est plus obligé de lire tout le flux avant de se mettre a aggreger.....
qqcvd est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 27/05/2011, 11h10   #3
Membre Expert
 
Avatar de Glutinus
 
Homme
Consultant en Business Intelligence
Inscription : avril 2005
Messages : 676
Détails du profil
Informations personnelles :
Sexe : Homme
Âge : 28
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Consultant en Business Intelligence
Secteur : Finance

Informations forums :
Inscription : avril 2005
Messages : 676
Points : 1 467
Points : 1 467
Si ton entrée est de la base de données, tu peux faire en sorte de faire immédiatement un order by (selon version d'informatica, soit tu renseignes Number of sorted input en déplaçant, dans ton SQ, les champs à classer au début ; soit tu overrides la requête en plaçant un order by). Tu pourrais éviter de passer par un sorter qui peut consommer du cache.

Si l'entrée est du fichier plat conséquent, il faudra sans doute utiliser un sorter.

Tu brasses combien de lignes ? S'il y en a "peu", ça va peut-être pas le coup d'utiliser de faire un sorter, mais c'est bien de connaître cette astuce.
Glutinus est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 30/05/2011, 16h56   #4
Nouveau Membre du Club
 
Avatar de Dodin
 
Inscription : avril 2009
Messages : 102
Détails du profil
Informations personnelles :
Âge : 26
Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

Informations forums :
Inscription : avril 2009
Messages : 102
Points : 37
Points : 37
Merci pour ta réponse !

Je brasse entre 3 et 12 millions de lignes. Effectivement ton astuce peut-être avantageuse.

Dodin est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 15h33.


 
 
 
 
Partenaires

Hébergement Web