Salut a tous !
Je rencontre un problème : je souhaite classer un texte dans un classe A ou B. Je dispose de deux tableaux de X cases qui contiennent les distances du texte que je veux classer avec des textes témoins de deux classes A et B. Pour déterminer la classe du texte, j'applique l'algo des K plus proches voisins. Cependant, par exemple si K vaut 11, qu'on trouve 6 voisins de classe A et 5 de classe B, naïvement on classe le texte dans la classe A. Seulement, il se peut que les 5 voisins de la classe B soient bien plus proches que les 6 de l'autre classe. Mon problème : il me faudrait pondérer ces résultats pour prendre en compte ça ! Et je sais pas du tout comment m'y prendre, vous auriez une idée svp ? J'ai bien regardé sur le net, et effectivement chaque fois qu'il est question de K voisins, y'a une histoire de pondération, mais quelle est exactement l'opération à appliquer??
J'espère avoir été clair !
Merci pour vos (nombreuses, j'espère)futures réponses !
Partager