Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > ETL
ETL Le Forum d'entraide ETL (Extract Transform Load) et Datawarehouse : DataStage, SunOpsis, Data Integrator, Informatica, OWB, Data Manager, Talend Open Studio,...
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 14/12/2007, 14h27   #1
Invité de passage
 
Inscription : décembre 2007
Messages : 1
Détails du profil
Informations forums :
Inscription : décembre 2007
Messages : 1
Points : 0
Points : 0
Par défaut comparatif etl talent pentaho/kettle - octopus-clover

je suis en train de faire un comparatif sur des etl, et je ne trouve pas de réponses à la question suivante:
comment se fait le nettoyage de données?
est-il possible d'ajouter des modules personnalisé pour nettoyer les données avant de les intégrer?
merci
anne.denibaud est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 20/12/2007, 15h52   #2
Invité régulier
 
Inscription : août 2007
Messages : 7
Détails du profil
Informations forums :
Inscription : août 2007
Messages : 7
Points : 8
Points : 8
Par défaut QU'entends tu par nettoyage ?

Data Quality Management ?
je me permets de te demander plus de précision : Qu'entends tu par nettoyage ?
altic93 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 20/12/2007, 20h28   #3
co2
Membre émérite
 
Avatar de co2
 
Inscription : mai 2002
Messages : 182
Détails du profil
Informations forums :
Inscription : mai 2002
Messages : 182
Points : 823
Points : 823
Envoyer un message via Skype™ à co2
Citation:
Envoyé par anne.denibaud Voir le message
comment se fait le nettoyage de données?
est-il possible d'ajouter des modules personnalisé pour nettoyer les données avant de les intégrer?
merci
Bonjour,

Tu as dans talend des composants permettant de faire du dedoublennage, des composants permettant de faire du fuzzyMatching qui est très utile quand on a des nom de clients qui sont mal saisie (cela fait une recherche via la phonetique des mots et non via l''orthographe de ces derniers ou bien cela autorise une tolérance paramétravle lors du lookup)...


HTH
Cédric
co2 est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 02h45.


 
 
 
 
Partenaires

Hébergement Web