IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Problème avec les lettres accentuées


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre habitué
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2017
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2017
    Messages : 10
    Par défaut Problème avec les lettres accentuées
    Bonjour,

    J'utilise le package twitteR pour récupérer des tweets.

    Je souhaite supprimer les accents des tweets. J'utilise la fonction de nettoyage suivante

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    unaccent = function(text) {
      # Supprime les accents
      text = gsub("['`^~\"]", " ", text)
      text = iconv(text, to="ASCII//TRANSLIT//IGNORE") 
      text = gsub("['`^~\"]", "", text)
      return(text)
    }
    Quand j'applique la fonction unaccent sur un tweet, les "é" sont remplacés par des "AC", les "è" par des "A?", etc.

    [1] "Le PA?re Castor entre A la?TUnesco : Mon grand-pA?re aurait certainement ACtAC fier https://t.co/gRKy9YFe57"
    Alors que si je copie le contenu du tweet et que je le colle dans la fonction nettoyage, cela fonctionne

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    unaccent("Le Père Castor entre à l’Unesco : \"Mon grand-père aurait certainement été fier\" https://t.co/gRKy9YFe57")
    [1] "Le Pere Castor entre a lUnesco : Mon grand-pere aurait certainement ete fier https://t.co/gRKy9YFe57"
    Comment expliquer ce problème ?

  2. #2
    Membre chevronné
    Inscrit en
    Février 2011
    Messages
    276
    Détails du profil
    Informations forums :
    Inscription : Février 2011
    Messages : 276
    Par défaut
    Bonjour,

    le problème vient probablement du format d'encodage des tweet et donc de leur import. Si le message est encodé dans un autre format (par exemple utf-8), alors dès l'import les accents sont perdus et toute fonction de nettoyage ne sert à rien. Première étape vérifier l'import des messages. Est-ce que ceci apparaissent dans le copier coller des tweets ou non ?

    cdlt

  3. #3
    Membre habitué
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2017
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2017
    Messages : 10
    Par défaut
    Je pense aussi que ça vient d'un problème d'encodage. Quand je fais Encoding (tweet), j'obtiens "UTF-8". Les messages semblent donc encodés en UTF- 8. Quand j'affiche les tweets, les accents apparaissent.

Discussions similaires

  1. Update VBA problème avec les lettres
    Par erni12 dans le forum VBA Access
    Réponses: 3
    Dernier message: 13/05/2016, 08h11
  2. problème avec les caractère accentué
    Par tarfoul dans le forum ASP.NET
    Réponses: 0
    Dernier message: 15/02/2011, 17h59
  3. Problème avec les lettres cyrillic
    Par rahmoucha dans le forum Entrée/Sortie
    Réponses: 7
    Dernier message: 03/12/2010, 11h40
  4. [Mail] Problème avec les accentuations
    Par heteroclite dans le forum Langage
    Réponses: 4
    Dernier message: 21/05/2008, 00h37
  5. Réponses: 6
    Dernier message: 12/12/2006, 11h27

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo