Bonjour,

Je cherche à cerner la logique de fonctionnement de la méthode utlm_match.edit_distance_similary.

Autant pour
tiré de la doc oracle "docs.oracle.com/..."
EDIT_DISTANCE Function

This function calculates the number of insertions, deletions or substitutions required to transform string-1 into string-2.
cela est très clair,

autant
EDIT_DISTANCE_SIMILARITY Function

This function calculates the number of insertions, deletions or substations required to transform string-1 into string-2, and returns the Normalized value of the Edit Distance between two Strings. The value is typically between 0 (no match) and 100 (perfect match)
reste très flou, surtout qu'avec une variation de la longueur des chaînes de caractères, le % résultant est différent. Alors qu'il est stable avec edit_distance.

J'ai vu que cela est basé sur un système de rang, mais la logique est difficile à percevoir.

Waldar avait écrit un article dont le lien est indiqué dans un de ses messages oracle et utl_match, mais le lien est mort

Avez-vous des pistes, des liens permettant de cerner le fonctionnement de cette méthode ?

Le but est présenter une probabilité de doublons entre des chaînes de caractères, et cela est plus clair pour un utilisateur avec des % que des variations de valeurs.

merci