IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Python Problème encodage


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    Lottery Winner
    Inscrit en
    Novembre 2008
    Messages
    38
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Autre

    Informations professionnelles :
    Activité : Lottery Winner

    Informations forums :
    Inscription : Novembre 2008
    Messages : 38
    Par défaut Python Problème encodage
    Bonjour,
    Je n'ai connais rien on programmation mais pour me faciliter la tâche à mettre a jour un projet (Liste Arabe Adblock Plus) sur le dépôt mercurial de google : http://code.google.com/p/liste-ar-ad...source/browse/. j'ai suivi un tutoriel pour qui nécessite l'installation de Python mais je suis bloquer quand je veux patcher le fichier modifier Liste_AR.txt parce qu'il contient des caractère en arabe et le fichier text est codé par défaut utf-8 !
    voila le message d'erreur:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    D:\liste-ar-adblock>FOP.py
    ============================================
    FOP (Filter Orderer and Preener) version 3.6
    ============================================
     
    Primary location: D:\liste-ar-adblock\
    Current directory: D:\liste-ar-adblock\
     
    The following changes have been recorded by the repository:
    Traceback (most recent call last):
      File "D:\liste-ar-adblock\FOP.py", line 398, in <module>
        start()
      File "D:\liste-ar-adblock\FOP.py", line 85, in start
        main(os.getcwd())
      File "D:\liste-ar-adblock\FOP.py", line 146, in main
        commit(repository, basecommand, originaldifference)
      File "D:\liste-ar-adblock\FOP.py", line 301, in commit
        print(difference.decode("utf-8"))
      File "C:\Python33\lib\encodings\cp850.py", line 19, in encode
        return codecs.charmap_encode(input,self.errors,encoding_map)[0]
    UnicodeEncodeError: 'charmap' codec can't encode characters in position 215-221:
     character maps to <undefined>
    merci pour votre aide.

  2. #2
    Membre prolifique
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 832
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 832
    Billets dans le blog
    1
    Par défaut
    Salut
    Rajoute la ligne # -*- coding: utf-8 -*- sous #!/usr/bin/env python3. Elle indique justement à Python qu'il devra traiter de l'utf8 (qui est un standard permettant de coder des caractères exotiques comme l'arabe ou le cyrillique)

    A titre d'exemple, ce code (en python2) lit parfaitement ton fichier
    Code python : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
     
    fp=open("Liste_AR.txt", "r")
    for lig in fp:
    	print lig
    fp.close()
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  3. #3
    Membre Expert

    Homme Profil pro
    Diverses et multiples
    Inscrit en
    Mai 2008
    Messages
    662
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Diverses et multiples

    Informations forums :
    Inscription : Mai 2008
    Messages : 662
    Par défaut
    Humm…

    Tout d’abord, la ligne # -*- coding: utf-8 -*- n’a à ma connaissance aucune influence dans la lecture d’un fichier, puisqu’elle ne spécifie que l’encodage du code source lui-même –*de plus, elle est superflue en py3, qui assume par défaut un encodage utf-8.

    smed79, tu peux dire merci à Windows et à sa console, qui ne supporte toujours pas nativement l’utf-8… Ce qui se passe, c’est que quand tu fais print(difference.decode("utf-8")), print doit ré-encoder ton str (ou ton unicode si tu es en py2) dans l’encodage console, soit le cp850

    N’étant pas windowsien, je ne sais pas s’il y a des moyens (détournés) de forcer windows à comprendre l’utf-8 dans sa console, sinon tu peux toujours explicitement convertir ton texte en cp850, en remplaçant les caractères inconvertibles par des “?”, par exemple print(difference.decode("utf-8").encode("cp850", 'replace').decode("cp850")) en py3, c’est moche et l’affichage ne sera pas beau (plein de “?” à la place des beaux “ﺔﻴﺑﺮﻌﻟﺍ”), mais plus de bug…

  4. #4
    Membre averti
    Homme Profil pro
    Lottery Winner
    Inscrit en
    Novembre 2008
    Messages
    38
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Autre

    Informations professionnelles :
    Activité : Lottery Winner

    Informations forums :
    Inscription : Novembre 2008
    Messages : 38
    Par défaut
    Salut,
    Comme dit mont29 # -*- coding: utf-8 -*- ne resolu pas le problème, apparemment c'est la faute de la console windows je vais tester sur Ubuntu et je revien vous dire j'ai quoi comme le résultat.

    Merci pour votre aide

  5. #5
    Membre averti
    Homme Profil pro
    Lottery Winner
    Inscrit en
    Novembre 2008
    Messages
    38
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Autre

    Informations professionnelles :
    Activité : Lottery Winner

    Informations forums :
    Inscription : Novembre 2008
    Messages : 38
    Par défaut résolu !
    Finalement il faut juste supprimé la ligne :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    print(difference.decode("utf-8"))
    Log : http://code.google.com/p/liste-ar-ad...path=%2FFOP.py

    Merci

  6. #6
    Membre averti
    Homme Profil pro
    Lottery Winner
    Inscrit en
    Novembre 2008
    Messages
    38
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Autre

    Informations professionnelles :
    Activité : Lottery Winner

    Informations forums :
    Inscription : Novembre 2008
    Messages : 38
    Par défaut
    l'inconvénient d'avoir enlevé la ligne qui posait problème est que le résumé du commit ne s'affiche plus.

    la solution c'est de remplacé :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    print(difference.decode("utf-8"))
    par :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    print(difference.decode('ascii', 'ignore'))
    Du coup, en le décodant en ASCII on oublie tous ces caractères-là, qui ne seront donc pas affichés, et on évite en outre d'afficher les erreurs dues à ces oublis grâce au paramètre d'erreur 'ignore'.

    Merci a Crits

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Problème encodage de certains caractères
    Par marieR dans le forum Servlets/JSP
    Réponses: 3
    Dernier message: 14/12/2006, 15h55
  2. Réponses: 4
    Dernier message: 28/09/2006, 20h20
  3. [DOM] Problème encodage
    Par spilliaert dans le forum Format d'échange (XML, JSON...)
    Réponses: 19
    Dernier message: 05/06/2006, 16h26
  4. Probléme encodage caractéres spéciaux MYSQL
    Par FoxLeRenard dans le forum Installation
    Réponses: 1
    Dernier message: 20/02/2006, 12h10
  5. Réponses: 1
    Dernier message: 02/02/2006, 23h12

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo