Bonjour à tous,

Je suis entrain de faire de l'analyse des données de Twitter.

J'ai à ma disposition un dataframe contenant plusieurs colonne( text, id, screenname, retweetcount, ...).
Tout d'abord, j'ai un problème de données , sûrement un problème d'encodage : dans mon dataframe, plus précisément dans la colonne text, j'ai des caractères à . Je pense que c'est un problème depuis l'extraction.

Puis, pour analyser le sentiment d'un tweet, j'ai utilisé les packages
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
library(sentimentr)
library(SentimentAnalysis)
library(RSentiment)
et la fonction calculate_sentiment pour savoir si un tweet est positive, negative ou neutral. Maintenant j'aimerais appliquer cette fonction à mon dataframe donc à la colonne [text] et stocker le résultat de chaque tweet quelque part ( par exemple dans une nouvelle colonne). J'ai essayé la fonction ddply mais je n'ai pas réussi à l'utiliser.

Pourriez - vous m'aider à résoudre ces 2 problèmes ? Je suis débutant.

Je vous remercie d'avance !