IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

kettle/PDI Discussion :

Agrégation de valeurs


Sujet :

kettle/PDI

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Inscrit en
    Juillet 2007
    Messages
    46
    Détails du profil
    Informations forums :
    Inscription : Juillet 2007
    Messages : 46
    Par défaut Agrégation de valeurs
    Bonjour,

    J'aimerai regrouper des données à partir d'une table "Dossier" où j'ai pour chaque enregistrement des données du type :
    - Code User
    - Date de création
    - N° dossier

    de manière à obtenir une table "Compteur jour " avec 1 ligne par jour et par user du type :
    - Code User
    - Date de création
    - Nombre de dossiers

    Et cela pour différentes tables métiers : tous les compteurs seraient donc groupés pour chaque utilisateur et chaque jour.

    Je pensais utiliser la transformation "Agregation valeurs" or dans l'exemple livré avec Kettle j'ai vu :

    "Count all not null values, BUT:
    This step type is deprecated --> DON'T USE IT ANY MORE !!!
    Please use the “Group By” step for a more powerful way of
    aggregating rows of data.

    THE AGGREGATE STEP WILL BE REMOVED IN A
    FUTURE VERSION."

    Qu'en pensez-vous ?
    Samatar si tu es là, j'attends tes bons conseils !!!

    Merci

  2. #2
    Membre chevronné
    Inscrit en
    Juin 2005
    Messages
    447
    Détails du profil
    Informations forums :
    Inscription : Juin 2005
    Messages : 447
    Par défaut
    Salut Remy,

    Ton exemple utilise l'étape ''Agrégation Lignes'' qui est obselète
    Utilise plutôt l'étape ''Agrégation valeurs"".

    Samatar

  3. #3
    Membre averti
    Inscrit en
    Juillet 2007
    Messages
    46
    Détails du profil
    Informations forums :
    Inscription : Juillet 2007
    Messages : 46
    Par défaut Bien vu !
    Effectivement je n'avais pas remarqué que ce n'était pas le bon icône !
    Tu sais s'il existe des exemples avec ce composant ?
    Dans l'aide, je n'ai vu que "Agregate Rows"...
    Et toi, l'as tu déjà utilisé ??
    En tout cas, merci !!

    NB : As-tu vu le livre blanc de comparaison des outils Talend/Kettle que je t'avais envoyé ? J'ai aussi vu qu'il y avait une demande de contribution sur la comparaison d'outils sur le forum....

  4. #4
    Membre chevronné
    Inscrit en
    Juin 2005
    Messages
    447
    Détails du profil
    Informations forums :
    Inscription : Juin 2005
    Messages : 447
    Par défaut
    En fait le sample dans ton répertoire sample présente un schéma avec les deux composants.
    L'utilisation de ce composant est assez simple:
    Tu mets dans "Champs groupe" dans la partie haute, tes champs de groupement.
    Dans ton cas :

    - Code User
    - Date de création

    Dans la partie en bas, tu mets tu choisis comme type "Nombre de valeurs" pour avoir le nombre de dossiers.


    J'ai attaché un exemple.

    Samatar

  5. #5
    Membre averti
    Inscrit en
    Juillet 2007
    Messages
    46
    Détails du profil
    Informations forums :
    Inscription : Juillet 2007
    Messages : 46
    Par défaut Agrégation complexe...
    Super ton site Samatar ! J'ai aussi mis en application la transformation que tu m'as envoyée (géniale !) et il me reste un problème : comment mettre dans un flux des agrégations de différentes tables ?

    Je m'explique, je veux grouper pour 1 user et 1 date (infos contenues dans chaque table) différents compteurs : nombre de dossiers (agrégation issue de table1), nombre d'OM (agrégation issue de table2)...Il faut que je regroupe les infos pour les mêmes user et mêmes dates.
    Je dois avoir au final dans un fichier pour chaque ligne : user, date, nb dossiers, nb om...

    Je joins à ce message ma transformation actuelle : tout allait bien tant que j'avais 2 flux d'agrégations distincts comme cela est fait dans le fichier xml par contre dès que j'essaie de les fusionner vers 1 fichier unique, plus rien ne va...

    Une idée ?

  6. #6
    Membre averti
    Inscrit en
    Juillet 2007
    Messages
    46
    Détails du profil
    Informations forums :
    Inscription : Juillet 2007
    Messages : 46
    Par défaut Solution !
    J'ai trouvé la solution à mon problème : pour regrouper dans un même flux des données venant de tables de structures différentes (ayant en commun certains champs clés), il suffit d'utiliser le composant "Jointure comparaison lignes". J'ai pris l'option "FULL JOIN" de manière à avoir les lignes présentes dans les 2 tables (sans filtre) et après sélection des champs souhaités, j'obtiens bien le bon résultat en sortie d'alimentation !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Connaître les valeurs avant agrégation
    Par guigui76esi dans le forum SQL
    Réponses: 2
    Dernier message: 02/06/2012, 15h39
  2. Agrégation de valeurs multiples
    Par mrgou dans le forum Langage SQL
    Réponses: 7
    Dernier message: 20/10/2011, 10h08
  3. Réponses: 2
    Dernier message: 15/06/2011, 11h13
  4. Réponses: 2
    Dernier message: 01/05/2009, 09h59
  5. agrégations des valeurs
    Par fraissoun dans le forum kettle/PDI
    Réponses: 1
    Dernier message: 28/04/2009, 10h39

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo