Bonjour,
J'utilise l'interface graphique Weka pour classer des documents texte. Mon data set est sous format ARFF. J'ai appliqué le filtre StringToWordVector. Puis, j'ai appliqué le filtre RemovePercentage pour diviser mes données en train et test sets. Mon data set contient 99 instances au total et 934 attributs. Après le train-test split, j'ai eu 66 instances pour la partie apprentissage et 33 instances pour la partie test.
L'apprentissage du modèle donne 100% comme accuracy.
Le test donne 3,0303% comme accuracy.
Quelqu'un pourrait-il m'aider à comprendre pourquoi j'ai eu 3,0303% et la façon d'améliorer ce résultat?