Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > ETL > Kettle-Pentaho
Kettle-Pentaho Forum d'entraide Kettle et Pentaho (Kettle, Pentaho Data Integrator)
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 22/02/2011, 19h57   #1
Invité régulier
 
Inscription : février 2011
Messages : 10
Détails du profil
Informations forums :
Inscription : février 2011
Messages : 10
Points : 6
Points : 6
Par défaut Kettle lecture fichier csv reprise après erreur

Salut a tous,
Voilà, je suis nouveau en BI et en Kettle. Je dois faire une transformation ou un job qui lit un fichier csv et pour chaque ligne lue, faire un traitement spécifique.
Je bute sur la reprise après erreur de lecture du fichier csv: en fait, les lignes du fichier csv peuvent avoir des données erronées (et donc provoquer des erreurs). Je dois après chaque erreur rencontrée, traiter celle-ci et continuer la lecture du fichier csv.

J'ai essayé la transformation "Validation des données", mais j'ai l'impression que ça ne marche pas.

Quelqu'un peut-il me fournir des astuces ou des remarques qui peuvent m'aider à avancer?
Je vous rappelle que je suis tout nouveau dans ce domaine.

Je vous remercie d'avance.
mario75 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/02/2011, 01h06   #2
Membre du Club
 
Mohamed Ali dali
Inscription : février 2010
Messages : 39
Détails du profil
Informations personnelles :
Nom : Mohamed Ali dali

Informations forums :
Inscription : février 2010
Messages : 39
Points : 47
Points : 47
Citation:
Envoyé par mario75 Voir le message
Salut a tous,
Voilà, je suis nouveau en BI et en Kettle. Je dois faire une transformation ou un job qui lit un fichier csv et pour chaque ligne lue, faire un traitement spécifique.
Je bute sur la reprise après erreur de lecture du fichier csv: en fait, les lignes du fichier csv peuvent avoir des données erronées (et donc provoquer des erreurs). Je dois après chaque erreur rencontrée, traiter celle-ci et continuer la lecture du fichier csv.

J'ai essayé la transformation "Validation des données", mais j'ai l'impression que ça ne marche pas.

Quelqu'un peut-il me fournir des astuces ou des remarques qui peuvent m'aider à avancer?
Je vous rappelle que je suis tout nouveau dans ce domaine.

Je vous remercie d'avance.
hello,

Je sais pas si c'est possible de faire ca avec kettle, je débute aussi dans le monde de BI mais ce que je fais moi pour le moment pour contourné ce problème, je crée une table d'accueil qui ressemble a la table ou j'insère mes données au final et au lieu d'insérer dans la table final j'insère dans la table d'accueil et j'associe dans la table d'accueil un trigger qui permet "AFTER INSERT" d'insérer les donnée que j'ai mit dans la table d'accueil et je traite les contrainte/erreur rencontrée.

j'espère que ca t'aide.

Cordialement,
dali.
Neomaven est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/02/2011, 22h32   #3
Invité de passage
 
Inscription : janvier 2011
Messages : 6
Détails du profil
Informations forums :
Inscription : janvier 2011
Messages : 6
Points : 3
Points : 3
Bonsoir,

L'étape "Filtrage ligne" des contrôles de flux devrait faire l'affaire.
Elle permet de tester une condition et de sélectionner le traitement suivant en fonction du résultat du test.

MT
Major Tom est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 11h31.


 
 
 
 
Partenaires

Hébergement Web