Bonjour,
je débute sur talend et j'aimerais comprendre un peu mieux comment faire des matching, j'ai un cas qui est simple en programmation mais que j'aimerais traduire sous forme de job talend.
voila j'ai 2 tables ou données avec des listes d'auteurs, avec le même schéma
exemple :
1er table :
1er table :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8 id_livre;nom;prenom 1;toto;jean 1;titi;julien 1;lulu;albert 2;toto;alain 2;mumu;gilles 2;tata;louis
(Erreur sur les noms entre livre1 dans les 2 tables "julie"!="julien"+ il manque un auteur dans table 2)
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8 2ème table id_livre;nom;prenom 1;toto;jean 1;titi;julie 2;toto;alain 2;mumu;gilles 2;tata;louis
j'ai donc 2 livres à comparer pour savoir s'il n'y a pas d'erreur dans les noms et prénoms et s'ils n'y pas pas de différences.
J'utilise tfuzzymatch avec l'algo de Levenshtein pour faire les comparaisons mais cela me semble limité.
Existe-il d'autre component dans la version community (gratuite) que je pourrais utiliser?
Comment je pourrais faire pour ne comparer que les livres qui ont le même identifiant?
Merci d'avance cela m'aidera à y voir un peu plus clair car je m'autoforme.
Partager