comparaison ou matching sur les noms et prénom
Bonjour,
je débute sur talend et j'aimerais comprendre un peu mieux comment faire des matching, j'ai un cas qui est simple en programmation mais que j'aimerais traduire sous forme de job talend.
voila j'ai 2 tables ou données avec des listes d'auteurs, avec le même schéma
exemple :
1er table :
Code:
1 2 3 4 5 6 7 8
|
id_livre;nom;prenom
1;toto;jean
1;titi;julien
1;lulu;albert
2;toto;alain
2;mumu;gilles
2;tata;louis |
1er table :
Code:
1 2 3 4 5 6 7 8
|
2ème table
id_livre;nom;prenom
1;toto;jean
1;titi;julie
2;toto;alain
2;mumu;gilles
2;tata;louis |
(Erreur sur les noms entre livre1 dans les 2 tables "julie"!="julien"+ il manque un auteur dans table 2)
j'ai donc 2 livres à comparer pour savoir s'il n'y a pas d'erreur dans les noms et prénoms et s'ils n'y pas pas de différences.
J'utilise tfuzzymatch avec l'algo de Levenshtein pour faire les comparaisons mais cela me semble limité.
Existe-il d'autre component dans la version community (gratuite) que je pourrais utiliser?
Comment je pourrais faire pour ne comparer que les livres qui ont le même identifiant?
Merci d'avance cela m'aidera à y voir un peu plus clair car je m'autoforme.