IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Probleme d'encodage et utilisation d'HTMLParser


Sujet :

Python

  1. #1
    Nouveau Candidat au Club
    Homme Profil pro
    Inscrit en
    Juillet 2012
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Juillet 2012
    Messages : 2
    Points : 1
    Points
    1
    Par défaut Probleme d'encodage et utilisation d'HTMLParser
    Bonjour,

    Tout d'abord mon erreur :


    Une erreur d'encodage semblerait-il...
    L'erreur apparaît quand le parser tombe sur " 'É " (sans les doubles quotes)
    Pour des chaînes avec des accents ça fonctionne, de même pour les majuscules avec les accents.

    Quelqu'un a une suggestion ? Je ne vois vraiment pas comment faire là. :s


    Je précise que le script est encodé utf8

  2. #2
    Membre confirmé
    Avatar de Captain'Flam
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2011
    Messages
    273
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur développement logiciels

    Informations forums :
    Inscription : Février 2011
    Messages : 273
    Points : 455
    Points
    455
    Billets dans le blog
    1
    Par défaut
    Ce serait pas mal d'avoir l'extrait de ton code qui lit le fichier...
    Mais je pense que ton erreur est très classique : un problème de codec.

    Ton fichier n'est pas de l'ASCII (i.e il contient des caractères dont le code est au delà de 127)
    Il faut donc préciser son encodage.

    Voici comment lire ton fichier :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    def read_text_file ( filename ):
        with open( filename,'rb' ) as f : 
            return f.read().decode('utf8')
    Cette fonction te retourne une chaîne unicode (qui sait encoder tous les caractères de l'utf8).
    Pour y voir plus clair, n'oublie pas que Wikipédia est ton ami !
    http://fr.wikipedia.org/wiki/Utf8
    Captain'Flam
    anciennement Sopsag, aka Hadrien
    Win seven x64 & Win 10 / Visual 2017 / Python 2.7 / Eclipse

  3. #3
    Nouveau Candidat au Club
    Homme Profil pro
    Inscrit en
    Juillet 2012
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Juillet 2012
    Messages : 2
    Points : 1
    Points
    1
    Par défaut
    J'avais réussi à régler le problème entre temps. J'ai fait comme tu le suggères : décodé mon fichier. C'était pas en utf8 cela dit mais en iso-8859-1.

    Merci quand même et à une prochaine fois !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Problème d'encodage
    Par Arnaud F. dans le forum Administration système
    Réponses: 5
    Dernier message: 26/05/2006, 22h56
  2. Problème d'encodage des caractères sous debian
    Par HNT dans le forum Administration système
    Réponses: 2
    Dernier message: 05/04/2006, 11h07
  3. probleme d'encodage
    Par iwky dans le forum Général Python
    Réponses: 4
    Dernier message: 24/03/2006, 20h30
  4. Probleme XML/XSL et utilisation d'ajax
    Par titou250 dans le forum XSL/XSLT/XPATH
    Réponses: 2
    Dernier message: 16/03/2006, 18h21
  5. Probleme avec encodage de simple quote
    Par linkowich dans le forum Langage
    Réponses: 2
    Dernier message: 31/10/2005, 13h16

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo