Bonjour,
J'ai un fichier où je voudrais calculer la fréquence de ses mot, les lignes de mot fichier se présentent comme suit :
naql bdae 0 --- nAqly bdAE --- NN NN --- naql bdae --- nn --- BASE --- 00 --- 543 --- 0 --- 0
où le numero 543 est le numéro du document où se trouve le mot naql bdae.
de telle sorte que mo fichier de sortie serait une matrice où les lignes est les mots du fichier et les colonnes sont les fréquences du mot dans le document:
D1…. Dn
Mot 1 f1 ….fn
Mot 2 f2 ….fn
Mot 2 f2 ….fn
Merci de votre aide
Partager