IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Problème avec les lettres accentuées


Sujet :

R

  1. #1
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2017
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2017
    Messages : 10
    Points : 7
    Points
    7
    Par défaut Problème avec les lettres accentuées
    Bonjour,

    J'utilise le package twitteR pour récupérer des tweets.

    Je souhaite supprimer les accents des tweets. J'utilise la fonction de nettoyage suivante

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    unaccent = function(text) {
      # Supprime les accents
      text = gsub("['`^~\"]", " ", text)
      text = iconv(text, to="ASCII//TRANSLIT//IGNORE") 
      text = gsub("['`^~\"]", "", text)
      return(text)
    }
    Quand j'applique la fonction unaccent sur un tweet, les "é" sont remplacés par des "AC", les "è" par des "A?", etc.

    [1] "Le PA?re Castor entre A la?TUnesco : Mon grand-pA?re aurait certainement ACtAC fier https://t.co/gRKy9YFe57"
    Alors que si je copie le contenu du tweet et que je le colle dans la fonction nettoyage, cela fonctionne

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    unaccent("Le Père Castor entre à l’Unesco : \"Mon grand-père aurait certainement été fier\" https://t.co/gRKy9YFe57")
    [1] "Le Pere Castor entre a lUnesco : Mon grand-pere aurait certainement ete fier https://t.co/gRKy9YFe57"
    Comment expliquer ce problème ?

  2. #2
    Membre confirmé
    Inscrit en
    Février 2011
    Messages
    276
    Détails du profil
    Informations forums :
    Inscription : Février 2011
    Messages : 276
    Points : 561
    Points
    561
    Par défaut
    Bonjour,

    le problème vient probablement du format d'encodage des tweet et donc de leur import. Si le message est encodé dans un autre format (par exemple utf-8), alors dès l'import les accents sont perdus et toute fonction de nettoyage ne sert à rien. Première étape vérifier l'import des messages. Est-ce que ceci apparaissent dans le copier coller des tweets ou non ?

    cdlt

  3. #3
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2017
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2017
    Messages : 10
    Points : 7
    Points
    7
    Par défaut
    Je pense aussi que ça vient d'un problème d'encodage. Quand je fais Encoding (tweet), j'obtiens "UTF-8". Les messages semblent donc encodés en UTF- 8. Quand j'affiche les tweets, les accents apparaissent.

Discussions similaires

  1. Update VBA problème avec les lettres
    Par erni12 dans le forum VBA Access
    Réponses: 3
    Dernier message: 13/05/2016, 08h11
  2. problème avec les caractère accentué
    Par tarfoul dans le forum ASP.NET
    Réponses: 0
    Dernier message: 15/02/2011, 17h59
  3. Problème avec les lettres cyrillic
    Par rahmoucha dans le forum Entrée/Sortie
    Réponses: 7
    Dernier message: 03/12/2010, 11h40
  4. [Mail] Problème avec les accentuations
    Par heteroclite dans le forum Langage
    Réponses: 4
    Dernier message: 21/05/2008, 00h37
  5. Réponses: 6
    Dernier message: 12/12/2006, 11h27

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo