Le titre n'est pas clair, alors voici l'explication de texte :
imaginons un fichier contenant 5000 lignes (des articles).
Je recherche un algo me permettant d'identifier de façon unique le texte de chaque ligne sous une forme numérique ou alphanum. Là, vous allez me dire qu'il suffit de créer un index. Sauf que le fichier n'est pas indexé et que je ne peux y rajouter que des articles, et aucun champ de plus. De plus, j'ai des raisons personnelles pour ne pas créer d'index
Le but de cet algo serait de calculer une sorte de checksum dépendant de la nomenclature de chaque article. Ainsi, si deux nomenclatures ne sont différentes ne serait-ce que d'un espace, alors les checksums seraient différents.
Je sais que c'est un truc bizarre, mais je n'ai pas la maitrise du fichier initial (c'est celui d'un fournisseur et il est stocké sur son site de production).
Tout ça pour me faciliter la phase de traitement de ce fichier et pour en faire une utilisation à ma sauce. Par exemple, la recherche de doublons ou autres serait plus simple (pour info, chaque article est identifié par une nomenclature comprenant de 53 à plus de mille caractères... Quand je vous dis que c'est un truc bizarre )
Donc si quelqu'un avait ce genre d'algo, une lib/compo utilisable sous Delphi ou au moins une piste de recherche, j'en serais reconnaissant.
PS : je suis nul en maths (4 au bac de Math, coef 9 - pas fait mieux depuis)
Partager