Bonjour,

Je cherche s'il existe une fonction qui permette de compter le nombre de mots d'un fichier pdf.

Pour être plus précise, j'ai utilisé le package text mining pour obtenir une matrice d'occurrence de termes d'un corpus de texte (une term document matrix). Je veux maintenant passer à une matrice de densité d'occurence des termes dans chacun des textes de mon corpus et pour cela, je veux diviser l'occurrence de chaque terme d'un texte par le nombre de mots de ce texte (pour ne pas donner un poids particulier aux textes longs).
Mais si quelqu'un peut déja m'aider à trouver une fonction qui donne le nombre de mot d'un pdf, j'ai bon espoir d'arriver à en faire quelque chose.

Merci d'avance pour votre aide