Bonjour à tous,
Je suis entrain de faire de l'analyse des données de Twitter.
J'ai à ma disposition un dataframe contenant plusieurs colonne( text, id, screenname, retweetcount, ...).
Tout d'abord, j'ai un problème de données , sûrement un problème d'encodage : dans mon dataframe, plus précisément dans la colonne text, j'ai des caractères à . Je pense que c'est un problème depuis l'extraction.
Puis, pour analyser le sentiment d'un tweet, j'ai utilisé les packages
et la fonction calculate_sentiment pour savoir si un tweet est positive, negative ou neutral. Maintenant j'aimerais appliquer cette fonction à mon dataframe donc à la colonne [text] et stocker le résultat de chaque tweet quelque part ( par exemple dans une nouvelle colonne). J'ai essayé la fonction ddply mais je n'ai pas réussi à l'utiliser.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3 library(sentimentr) library(SentimentAnalysis) library(RSentiment)
Pourriez - vous m'aider à résoudre ces 2 problèmes ? Je suis débutant.
Je vous remercie d'avance !
Partager