IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

accents transformés avec scan


Sujet :

R

  1. #1
    Membre du Club
    Homme Profil pro
    touristepationné
    Inscrit en
    Janvier 2012
    Messages
    132
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : touristepationné
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Janvier 2012
    Messages : 132
    Points : 57
    Points
    57
    Par défaut accents transformés avec scan
    Bonjour!

    Voici le code que j'utilise pour récupérer le code source d'une page web:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    txt<-scan("www.page.com",what=character(),sep="\n")
    write(txt, "TEST.txt")
    Mon problème est que si je demande à R de m'afficher une ligne:
    Patatrass! les caractères avec accents sont transformés en caractères étranges.

    Pourtant si j'enregistre manuellement ce code source dans un txt, en l'encodant en ANSI, R ne me transforme plus les accents en bizarreries.

    Pourquoi?

  2. #2
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    Avez-vous essayé de spécifier un format d'encodage lors de l'appel à "scan" : scan( "www.page.com", what=character(), sep="\n", encoding="latin1" ), par exemple?


    Cordialement,

    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  3. #3
    Membre du Club
    Homme Profil pro
    touristepationné
    Inscrit en
    Janvier 2012
    Messages
    132
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : touristepationné
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Janvier 2012
    Messages : 132
    Points : 57
    Points
    57
    Par défaut
    euh... oui. en latin1 ANSI et un autre.
    Et ça ne marchait alors pas. Je viens de recommencer avant de vous répondre, et maintenant ça marche!
    Je comprends rien, mais merci tout de même!

  4. #4
    Membre du Club
    Homme Profil pro
    touristepationné
    Inscrit en
    Janvier 2012
    Messages
    132
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : touristepationné
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Janvier 2012
    Messages : 132
    Points : 57
    Points
    57
    Par défaut
    Ah! Non ça marche pas en fait! Je me disais aussi... le bloc note me l'affiche avec les bons caractères, mais R se plante.

  5. #5
    Membre du Club
    Homme Profil pro
    touristepationné
    Inscrit en
    Janvier 2012
    Messages
    132
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : touristepationné
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Janvier 2012
    Messages : 132
    Points : 57
    Points
    57
    Par défaut
    J'ai trouvé !!!
    Un peu plus loin dans mon code j'ai utilisé readLines, sans spécifier l'encodage en UTF-8. Elle était là mon erreur! Scan marche très bien...

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [XSLT] XML-->XSLT output format apres transformation avec un x
    Par Hoegaarden dans le forum Format d'échange (XML, JSON...)
    Réponses: 8
    Dernier message: 06/09/2010, 11h51
  2. accents transformés en ?
    Par mdr_cedrick dans le forum Langage
    Réponses: 5
    Dernier message: 22/02/2008, 17h03
  3. [SAX] Transformation avec SAX
    Par pc.bertineau dans le forum Format d'échange (XML, JSON...)
    Réponses: 4
    Dernier message: 25/01/2008, 11h08
  4. Problème sur classe Transformer avec les <!--
    Par tykool dans le forum Format d'échange (XML, JSON...)
    Réponses: 1
    Dernier message: 10/01/2006, 10h20
  5. [Accents] Traitement avec Java et le terminal Windows
    Par Doom dans le forum Entrée/Sortie
    Réponses: 4
    Dernier message: 13/07/2004, 09h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo