Bonjour,
je dispose autant de fichiers que de textes composant le corpus, un fichier pour chaque texte regroupant les termes du texte.
mon texte est sous la forme :
[NP tHwl/NN tAryxy/JJ] [PP fy/IN] [NP mkAfHp/NN] .
je veux par ces NP et avoir en sortie le fichier suivant:
Termes D1...........Dn
[NPtHwl/NN tAryxy/JJ] freq1 ...... freqN
.
.
etc
où D1 à Dn sont les documents et freq1.. freqN est la frequence par du [NPtHwl/NN tAryxy/JJ] dans le document 1 par exemple.
Comment puis-je faire pour programmer ça en Perl?
Pouvez-vous m'aider
Partager