-
Weka data mining
salut a tous bon voila mon encadreur ma envoyer ce mail
Tu prends le corpus, tu le formates dans un format acceptable par un outil de data mining, Weka ou Rapidminer par exemple (un jeu d'enfant).
Puis tu utilises l'outil pour faire les différentes segmentation et expérimentations avec les différentes algorithmes deja disponible sur l'outil. Toi, tu te contente de noter les différents résultats obtenus pour les différentes segmentations et algorithmes.
mon corpus contien des adress url classifier par catégorie mai catégorie sans : Arts, Business, Computer, Games, Health, Home, Kids, News, Recreation.
alors si qu'elle qu'un a comprie qu'elle que chose qu'il m'explique s'il vous plaît.
-
Et bien en gros tu as des données (ton corpus) qu'il faut que tu mettes sous un standard, afin qu'il soit lisible par tes logiciels cités; Donc en gros tu regardes comment les logiciels écrivent ces corpus.
Et après il faut que tu testes les perfs de ces outils (en lisant tes corpus?).