Bonsoir à tous !
J'ai une question concernant l'algorithme d'optimisation par essaim particulaires appliqué à une collection de documents dans le but de les classifier (clustering).
Je pense avoir compris le principe du PSO qui consiste à considérer toutes les particules d'une population comme des solutions potentielles et de trouver la solution optimale parmi celles-ce en utilisant une recherche globale. Seulement voilà, dans le cas du clustering de documents je ne comprends pas ce qui représente les solutions. Est-ce que c'est les centroïdes des clusters ou bien l'ensemble des documents ? Je pense que c'est les centroides mais je n'en suis pas sûre...
Ce que j'ai compris c'est que :
Au départ on a un ensemble de vecteurs qui représente les documents de la collection. On commence par choisir au hasard un ensemble de k documents qui représentent les centroïdes ensuite les autres documents changeront de position en prenant en compte leur direction actuelle leur meilleure performance et la meilleur performance du groupe pour se rapprocher du centroïde le plus proche.
Je voudrais savoir si cela est juste ou non.

Merci d'avance.