Bonjour a tous, j'ai besoin d'un coupe de main pour déterminer la proximité syntaxique de différent termes
J'ai fait mes testes sur un corpus de mots codé en utf-8, j'utilise pour déterminer la proximité l'algo de Levensthein. Tout marche au poil tant que les mots de contiennent pas d'accent, par exemple la distance entre zero et zero vaut 0 jusque la tout vas bien mais entre zero et zéro elle diffère j'ai procédé a de nombreux essaie il semble que dans la fourchette de valeur de 0 - 6 ont peu considéré deux mot comme a peut prèt identique.
Mon observation est elle juste ?
De plus une autre question ce pose, si j'évalue zéro et zéra comment faire pour que zéra ne soit pas pris en compte ? parce que je veut bien garder zéro zero mais pas zéra puisque sa n'a rien a voir meme si sa distance est de 1
Partager