Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > ETL > Kettle-Pentaho
Kettle-Pentaho Forum d'entraide Kettle et Pentaho (Kettle, Pentaho Data Integrator)
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 15/04/2011, 15h28   #1
Invité régulier
 
Femme
Étudiant
Inscription : mars 2011
Messages : 6
Détails du profil
Informations personnelles :
Sexe : Femme
Localisation : Maroc

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : mars 2011
Messages : 6
Points : 6
Points : 6
Par défaut produit cartésien dans Pentaho

Bonjour,
j'ai un souci concernant le temps d'exécution.
la transformation est la suivante:
- j'extrais les données à partir d'un fichier log et je décompose les champs comme je veux
- ensuite, je dois lier le champs login avec les informations existant dans un fichier Excel , pour cela j'ai utilisé "produit cartésien"
- puis j'alimente la table MySQL

la transformation tourne bien mais prend BEAUCOUP de temps: pour un fichier de 5 Mo, ça prend 2h.
le fichier Excel contient à peu près 13000 entrées.
y a-t-il pas un moyen pour optimiser le temps d'exécution ?

Merci d'avance
Images attachées
Type de fichier : jpg transformation.jpg (33,3 Ko, 18 affichages)
salemi est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 16/04/2011, 15h22   #2
Membre éprouvé
 
Consultant en Business Intelligence
Inscription : mai 2008
Messages : 191
Détails du profil
Informations personnelles :
Localisation : France

Informations professionnelles :
Activité : Consultant en Business Intelligence

Informations forums :
Inscription : mai 2008
Messages : 191
Points : 479
Points : 479
Salut Salemi

Tu ferais mieux d'utiliser l'étape "Recherche dans flux" (stream lookup) pour effectuer la jointure sur ton login.
Les données de ton fichier EXCEL, à renseigner comme l'étape "source de données" du Stream Lookup pourront alors être mises en cache, et ça devrait être nettement + rapide

A tester !

Sylvain - http://www.osbi.fr
sdecloix est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/04/2011, 01h21   #3
Invité régulier
 
Femme
Étudiant
Inscription : mars 2011
Messages : 6
Détails du profil
Informations personnelles :
Sexe : Femme
Localisation : Maroc

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : mars 2011
Messages : 6
Points : 6
Points : 6
Merci bcp.
ça a marché. le temps d'exécution ne dépasse plus les qlq secondes.
Merci
salemi est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 18/04/2011, 09h06   #4
Membre éprouvé
 
Consultant en Business Intelligence
Inscription : mai 2008
Messages : 191
Détails du profil
Informations personnelles :
Localisation : France

Informations professionnelles :
Activité : Consultant en Business Intelligence

Informations forums :
Inscription : mai 2008
Messages : 191
Points : 479
Points : 479
super, il n'y a plus qu'à mettre votre ticket en "résolu"
sdecloix est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 03h14.


 
 
 
 
Partenaires

Hébergement Web