IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

encore de l'encodage. [Python 3.X]


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre Expert
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 617
    Par défaut encore de l'encodage.
    Bonjour,
    J'ai voulu passer un script pour python2.7 qui fonctionne très bien en python3.
    Je me heurte à des soucis d'encodage.

    Après plusieurs modifications, j'arrive à cela :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    reca = soup.find( "p", {"class":"m_content_recette_ingredients"} )
    ingred = str(reca)
     
    method = re.compile(r'<a.*?">', re.IGNORECASE)
    ingredi = re.sub(method, '', ingred)
    print(type(ingredi))
    ingredi_utf8 = ingredi.encode("utf-8" ).replace("<h4>", "")
    et voici le message d'erreur :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    <class 'str'>
    Traceback (most recent call last):
     
      File "<ipython-input-6-f64baab7259c>", line 1, in <module>
        runfile('/media/marco3/Données 1,9To/Informatique/python/python-marmiton/pate-pizza-5-pyth3.py', wdir='/media/marco3/Données 1,9To/Informatique/python/python-marmiton')
     
      File "/usr/local/lib/python3.3/dist-packages/spyderlib/widgets/externalshell/sitecustomize.py", line 586, in runfile
        execfile(filename, namespace)
     
      File "/usr/local/lib/python3.3/dist-packages/spyderlib/widgets/externalshell/sitecustomize.py", line 48, in execfile
        exec(compile(open(filename, 'rb').read(), filename, 'exec'), namespace)
     
      File "/media/marco3/Données 1,9To/Informatique/python/python-marmiton/pate-pizza-5-pyth3.py", line 125, in <module>
        ingredi_utf8 = ingredi.encode("utf-8" ).replace("<h4>", "")\
     
    TypeError: expected bytes, bytearray or buffer compatible object
    Soit j'ai du type "byte" et cela ne m'intéresse pas car le module "re" plante, soit je n'en ai pas et python en réclame.

    Si quelqu'un peut m'aiguiller...

  2. #2
    Expert confirmé

    Homme Profil pro
    Inscrit en
    Octobre 2008
    Messages
    4 307
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Octobre 2008
    Messages : 4 307
    Par défaut
    Salut,

    Normalement, tu décodes, pas le contraire.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
     
    >>> s = "éèà"
    >>> e = s.encode("utf-8")
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
    UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 0: ordinal not in range(128)
    >>> e = s.decode("utf-8")
    >>> e
    u'\xe9\xe8\xe0'
    >>> print e
    éèà
    >>>
    Tu peux donner un exemple de contenu de ingredi ?


    Edit: Je vois que le message d'erreur est en python3, dans ce cas str est déjà unicode, qu'est-ce-que tu cherches à faire exactement ?

  3. #3
    Membre Expert
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 617
    Par défaut
    Merci VinsS pour ton aide,

    J'ai modifié mon code comme ceci :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    reca = soup.find( "p", {"class":"m_content_recette_ingredients"} )
    ingred = str(reca)
     
    method = re.compile(r'<a.*?">', re.IGNORECASE)
    ingredi = re.sub(method, '', ingred)
     
    ingredi_utf8 = ingredi.replace("<h4>", "")\
    .replace('<p class="m_content_recette_ingredients">', "").replace("oeuf","\oe uf")\
    .replace("<br/><br />", "\n").replace("-","\n\\item").replace("<br/>","")\
    .replace("°","$^{~o}$").replace("</div>", "").replace("<span>","").replace("</a>","")\
    .replace("</span>","").replace("</p>","")
     
    open("ingred.tex","w").write(ingredi_utf8)
    et cela fonctionne.
    Je cherchais à écrire un fichier au format .tex à partir d'une page html (recette marmiton)...

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Encore et toujours l'encodage UTF-8
    Par guilopouloos dans le forum Servlets/JSP
    Réponses: 3
    Dernier message: 05/01/2012, 13h34
  2. Encore un problème d'encodage de caractéres
    Par Memelo dans le forum Administration
    Réponses: 0
    Dernier message: 07/10/2010, 10h53
  3. Encore un problème d'encodage !
    Par Phonatacid dans le forum Débuter avec Java
    Réponses: 3
    Dernier message: 31/01/2010, 20h37
  4. Encodage de caractères .. encore !
    Par bebR31 dans le forum SQL Procédural
    Réponses: 3
    Dernier message: 29/10/2007, 12h04
  5. Encodage de caractère. . . encore
    Par ePoX dans le forum SQL Procédural
    Réponses: 1
    Dernier message: 11/08/2006, 11h13

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo