IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Développement de jobs Discussion :

comparaison ou matching sur les noms et prénom


Sujet :

Développement de jobs

  1. #1
    Membre à l'essai
    Inscrit en
    Mai 2005
    Messages
    25
    Détails du profil
    Informations forums :
    Inscription : Mai 2005
    Messages : 25
    Points : 13
    Points
    13
    Par défaut comparaison ou matching sur les noms et prénom
    Bonjour,
    je débute sur talend et j'aimerais comprendre un peu mieux comment faire des matching, j'ai un cas qui est simple en programmation mais que j'aimerais traduire sous forme de job talend.
    voila j'ai 2 tables ou données avec des listes d'auteurs, avec le même schéma
    exemple :
    1er table :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
    id_livre;nom;prenom
    1;toto;jean
    1;titi;julien
    1;lulu;albert
    2;toto;alain
    2;mumu;gilles
    2;tata;louis
    1er table :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
    2ème table
    id_livre;nom;prenom
    1;toto;jean
    1;titi;julie
    2;toto;alain
    2;mumu;gilles
    2;tata;louis
    (Erreur sur les noms entre livre1 dans les 2 tables "julie"!="julien"+ il manque un auteur dans table 2)

    j'ai donc 2 livres à comparer pour savoir s'il n'y a pas d'erreur dans les noms et prénoms et s'ils n'y pas pas de différences.
    J'utilise tfuzzymatch avec l'algo de Levenshtein pour faire les comparaisons mais cela me semble limité.
    Existe-il d'autre component dans la version community (gratuite) que je pourrais utiliser?
    Comment je pourrais faire pour ne comparer que les livres qui ont le même identifiant?
    Merci d'avance cela m'aidera à y voir un peu plus clair car je m'autoforme.

  2. #2
    Membre régulier
    Profil pro
    INGENIEUR DE RECHERCHE
    Inscrit en
    Février 2003
    Messages
    74
    Détails du profil
    Informations personnelles :
    Âge : 57
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : INGENIEUR DE RECHERCHE

    Informations forums :
    Inscription : Février 2003
    Messages : 74
    Points : 87
    Points
    87
    Par défaut
    Tu peux aussi utiliser un tMap en faisant une jointure sur tous les champs et en utilisant l'option "Catch lookup inner join reject" = True dans les propriétés du shéma de sortie. La sortie te renverra tous les enregistrements qui ne respectent pas la jointure.
    Spiale

  3. #3
    Membre à l'essai
    Inscrit en
    Mai 2005
    Messages
    25
    Détails du profil
    Informations forums :
    Inscription : Mai 2005
    Messages : 25
    Points : 13
    Points
    13
    Par défaut
    Oui, ok c'est vrai je n'y avais pas pensais à une simple jointure, mais cela reste une comparaison stricte hors je veux utiliser des comparaisons type algo Levenshtein pour les valeurs resemblantes.
    Merci quand même !

Discussions similaires

  1. Gestion des erreurs sur les noms des villes
    Par yosryosr dans le forum Pascal
    Réponses: 3
    Dernier message: 18/04/2008, 11h52
  2. [RegEx] Filtre pour les Noms et prénoms
    Par Merovingien dans le forum Langage
    Réponses: 3
    Dernier message: 18/04/2008, 09h23
  3. gestions des erreurs sur les Noms des villes
    Par yosryosr dans le forum Langage
    Réponses: 2
    Dernier message: 15/04/2008, 12h07
  4. Les accents sur les noms des fichiers passent mal
    Par fab53 dans le forum Langage
    Réponses: 3
    Dernier message: 04/01/2008, 15h05
  5. [DOM] Problème d'accent sur les noms de fichier avec mon parseur
    Par ujoodha dans le forum Format d'échange (XML, JSON...)
    Réponses: 3
    Dernier message: 06/04/2006, 21h55

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo