IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Problème avec les chardet depuis passage en V3 [Python 3.X]


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Inscrit en
    Juin 2005
    Messages
    243
    Détails du profil
    Informations forums :
    Inscription : Juin 2005
    Messages : 243
    Par défaut Problème avec les chardet depuis passage en V3
    Bonjour tout le monde,

    J'ai une fonction qui marche bien en V2 mais depuis que je suis passé en V3 ça ne marche plus.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    def get_file_encoding(filepath):
        raw_data = open(filepath, "r").read()  # chardet is not compatible with context manager
        result = chardet.detect(raw_data)
        if result.get('confidence') > .5:
            char_enc = result.get('encoding')
        else:
            char_enc = 'utf-8'
        return char_enc
    J'ai le message :
    Expected object of type bytes or bytearray, got: <class 'str'>

    En fouillant, j'ai trouvé d'où ce message venait :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    def detect(byte_str):
        """
        Detect the encoding of the given byte string.
    
        :param byte_str:     The byte sequence to examine.
        :type byte_str:      ``bytes`` or ``bytearray``
        """
        if not isinstance(byte_str, bytearray):
            if not isinstance(byte_str, bytes):
                raise TypeError('Expected object of type bytes or bytearray, got: '
                                '{0}'.format(type(byte_str)))
    (code tiré de la librairie)

    Le problème est donc qu'il attend un type byte et là c'est vu en string.

    j'ai alors essayé de convertir en bytes mais que neni :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    result = chardet.detect(str.encode(raw_data))
    Donne :
    'str' object has no attribute 'decode'
    Voyez-vous comment je peux faire marcher cette fonction en python V3 SVP ? Je ne vois plus comment faire ?

    D'avance, merci pour votre réponse et aide !!

  2. #2
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 762
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 762
    Par défaut
    Salut,

    Citation Envoyé par soad029 Voir le message
    Voyez-vous comment je peux faire marcher cette fonction en python V3 SVP ? Je ne vois plus comment faire ?
    Si chardet attend des bytes dans raw_data, il faut mettre des bytes dans raw_data. raw_data étant le contenu du fichier, le lire en mode binaire devrait suffire.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Membre éclairé
    Inscrit en
    Juin 2005
    Messages
    243
    Détails du profil
    Informations forums :
    Inscription : Juin 2005
    Messages : 243
    Par défaut
    Bonjour Wiztrick
    Merci bcp pour votre réponse.
    Je l ai ouvert avec les options "rb"
    Mais j ai toujours le même message, c est trop étrange..

  4. #4
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 762
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 762
    Par défaut
    Salut,

    Citation Envoyé par soad029 Voir le message
    Je l ai ouvert avec les options "rb"
    Mais j ai toujours le même message, c est trop étrange..
    C'est pas compliqué à reproduire:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    >>> import chardet
    >>> raw_data = open('zzzz.py').read()
    >>> chardet.detect(raw_data)
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
      File "C:\py_env\py64_38\lib\site-packages\chardet\__init__.py", line 33, in de
    tect
        raise TypeError('Expected object of type bytes or bytearray, got: '
    TypeError: Expected object of type bytes or bytearray, got: <class 'str'>
    et à corriger:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    >>> raw_data = open('zzzz.py', 'rb').read()
    >>> chardet.detect(raw_data)
    {'encoding': 'ascii', 'confidence': 1.0, 'language': ''}
    >>>

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  5. #5
    Membre éclairé
    Inscrit en
    Juin 2005
    Messages
    243
    Détails du profil
    Informations forums :
    Inscription : Juin 2005
    Messages : 243
    Par défaut
    Oui désolé, en fait ça marchait bien (le nouille...), le message que j'ai provient d'un autre problème

    Maintenant j'ai ce message :
    'str' object has no attribute 'decode'


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
            data = f.read(max_file_size)
            try:
                data = data.decode(char_enc, errors="replace")  # type: ignore
    Je regarde pourquoi j'ai ça.. si jamais vous voyez sans trop chercher je suis preneur sinon je continue mes recherches.

    Merci bcp en tout cas, gràce à vous j'avance !

  6. #6
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 762
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 762
    Par défaut
    Salut,

    Si "data" est "str", c'est que le fichier n'a pas été ouvert en mode binaire.
    Si c'est le même fichier que le fichier précédent, çà ne devrait pas être.

    Si c'est un autre fichier, vous connaissez son "encoding", autant faire faire le boulot de "décodage" à Python (en le passant à open).

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Problème avec les sessions php depuis que j'ai installé php 7.2.0 !
    Par Artemus24 dans le forum EDI, CMS, Outils, Scripts et API
    Réponses: 6
    Dernier message: 03/12/2017, 19h27
  2. Réponses: 2
    Dernier message: 06/01/2017, 12h52
  3. Réponses: 0
    Dernier message: 20/01/2009, 14h57
  4. Réponses: 2
    Dernier message: 12/02/2007, 21h12
  5. Réponses: 1
    Dernier message: 18/01/2007, 17h52

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo