Indexation et pondération
salut
Je veux faire la conception d'un indexeur de page HTML en utilisant la méthode statistique-pondération mais je ne trouve pas un algorithme et des formules mathématiques qui réunissent les différents poids donnés aux champs pertinents dans le doc HTML (titre, meta, gras,url)+ la fréquence des mots.
Merci d'avance
Indexation et pondération
bonjour
j'ai essayé de chercher dans lucene mais sans résultat..je seulement voir un exemple d'une formule utilisée dans un moteur de recherche pour calculer le poids d'un mot clé.
merci