Bonjour,
Actuellement sur un projet de textmining, je cherche à supprimer tous les mots interdits (stockés dans un vecteur : stoplist= stopwords(kind = "fr")).
A la base, le texte est tiré d'un pdf, qui a été transformé en .txt. Avec readLines, je peux concaténer tout ça dans une variable text. J'utilise la library stringr et non tm ( impossible de le faire avec )..
Si quelqu'un à une solution, je suis preneur.
Merci d'avance pour votre réponse.
Cordialement.
Partager