IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

vecteur de caractères - enlever tous les accents


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Profil pro
    Inscrit en
    Mai 2005
    Messages
    465
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations forums :
    Inscription : Mai 2005
    Messages : 465
    Par défaut vecteur de caractères - enlever tous les accents
    Bonjour,

    J'ai un vecteur contenant des noms de communes.
    Je souhaite enlever tous les accents aux noms.
    Quelle est la façon la plus élégante de réaliser cela?

    Merci!

  2. #2
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 37
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Par défaut
    Bonjour,

    Je ne connais pas de fonction R permettant d'enlever en une seule fois tous les mots contenant des accents quel que soit le type d'accent. Par contre, on peut utiliser la fonction "gsub" pour chaque type de lettre accentué, sur le principe suivant :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    v<-c("carré","sèche","être","là")
     
    v<-sub("é","e",v)
    v
    [1] "carre" "sèche" "être"  "là"   
     
    v<-sub("à","a",v)
    v
    [1] "carre" "sèche" "être"  "la"
    Du coup, si vous êtes amené à faire souvent ce genre de manip', cela peut valoir le coup de se créer une petite fonction "subAccent" par exemple, qui remplace toutes les lettres accentuées par leur équivalent non accentué.

    Bonne continuation


    Cordialement,

    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  3. #3
    Membre éclairé
    Profil pro
    Inscrit en
    Mai 2005
    Messages
    465
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations forums :
    Inscription : Mai 2005
    Messages : 465
    Par défaut
    ok pour l'instant, j'utilise qqch du genre
    ce qui n'est pas très élégant.
    La fonction est une bonne idée.

    Merci!

  4. #4
    Membre Expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Par défaut
    Bonjour,

    Il y a peut-être encore plus direct, mais pour commencer, tu peux déjà travailler par voyelle, en recherchant en une seule ligne toutes les variantes accentuées :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    > v <- c("carré", "sèche", "être", "là")
    
    > gsub("[éèëê]", "e", v)
    [1] "carre" "seche" "etre"  "là"
    Il s'agit simplement d'utiliser des plages de caractères (entre []) dans le motif de l'expression régulière.

    Et permet de traiter en une fois toutes les occurrences du motif dans une même chaîne :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    > sub("[éèëê]", "e", "créé")
    [1] "creé"
    > gsub("[éèëê]", "e", "créé")
    [1] "cree"

  5. #5
    Membre Expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Par défaut
    Re,

    Il y a une fonction qui fait de la "traduction de caractères" :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    > v <- c("carré", "sèche", "être", "là", "Ça")
    > chartr("éèëêÉÈËÊàÀçÇ", "eeeeEEEEaAcC", v)
    [1] "carre" "seche" "etre"  "la"    "Ca"

Discussions similaires

  1. Enlever tous les accents dans le nom d'un fichier
    Par Abou Zar dans le forum Langage
    Réponses: 1
    Dernier message: 13/02/2010, 06h58
  2. enlever tous les espaces d'une chaine
    Par franfr57 dans le forum Général JavaScript
    Réponses: 1
    Dernier message: 24/01/2007, 09h00
  3. Enlever tous les retours à la ligne d'une table
    Par jehhej dans le forum Requêtes
    Réponses: 1
    Dernier message: 25/11/2006, 11h05
  4. Enlever tous les System.out
    Par Dinytro dans le forum Eclipse Java
    Réponses: 6
    Dernier message: 04/09/2006, 17h26
  5. Enlever tous les M&Mme des enregistrements
    Par marc olivier dans le forum MS SQL Server
    Réponses: 2
    Dernier message: 17/07/2003, 12h24

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo