Bonjour a tous,

Je travail sur la classification automatique de textes à partir d'une matrice terme document constitué suite aux différents procédés de lemmatisation, tokenisation... Je m'interrogeais sur les indices de similarités d'un textes et des distances entre mots ou texte qui peuvent exister afin de faire une classification avec l’algorithme SVM(Support Vecteur Machin) par exemple par thèmes de document.

Je vous remercie de votre aide,
Dans l'attente de vous lire.