Salut,
j'aurais voulu avoir votre avis sur les méthodes les plus efficaces pour faire de la comparaison de texte.
Typiquement je souhaite comparer 2 noms de sociétés ou 2 adresses, et fonction du resultat je considère que les valeurs sont bonnes ou non.
Exemples
- "JPcheck Consulting" vs "JPCheck Consulting EURL" doit être OK
- "66 avenue des Champs Elysees" vs "66 av des Champs Elysees" doit aussi être OK
Les algo parmi lesquels j'ai des pistes pour l'instant :
Boyer-Moore
Knuth-Morris-Pratt
j'ai testé la distance de Levenshtein mais en cas de nom trop court (je fais un Leven / longueur max des chaines), j'ai un OK au lieu d'un NOK.
Les contraintes qui me posent particulièrement problème :
- les abréviations qui peuvent être de tout type (adresse mais aussi type de société)
- le nombre de mots à comparer qui diffère
vous auriez des recommandations à me faire ?
Partager