IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Petit souci d'encodage avec le module chardet [Python 3.X]


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre Expert
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 617
    Par défaut Petit souci d'encodage avec le module chardet
    Bonsoir,
    Je souhaiterais utiliser le module "chardet" mais chez moi, cela ne fonctionne pas comme je le souhaiterais.
    En effet, je dispose de 2 fichiers, l'un codé en latin1 (test-iso.tex), l'autre en utf-8 (testutf.tex). Or, les instructions suivantes me donnent GB2312 dans les 2 cas.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    import chardet
     
    f = open("test-iso.tex","rb")
    fich_f=f.read()
    code_f = chardet.detect(fich_f)['encoding']
    print(code_f)  
    print()
     
     
    g = open("test-utf.tex","rb")
    fich_g=g.read()
    code_g = chardet.detect(fich_g)['encoding']
    print(code_g)
    Quelqu'un a une idée ?

  2. #2
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 762
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 762
    Par défaut
    Salut,

    Les fichiers ".tex" comme les fichier scripts Python ont la possibilité de préciser l'encoding du fichier de façon explicite.
    "chardet" n'est là que pour les cas désespérés: une heuristique assez bonne lorsqu'on ne peut faire autrement.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Membre Expert
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 617
    Par défaut
    Citation Envoyé par wiztricks Voir le message
    Salut,

    Les fichiers ".tex" comme les fichier scripts Python ont la possibilité de préciser l'encoding du fichier de façon explicite.
    "chardet" n'est là que pour les cas désespérés: une heuristique assez bonne lorsqu'on ne peut faire autrement.

    - W
    Merci wiztricks,
    2 remarques :
    - un copain sous Mac utilise "chardet" sans souci apparemment.
    - un petit script python pour encoder mes anciens fichiers qui était en latin1 m'aurait bien plu. Si ce n'est pas possible, tant pis !

  4. #4
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 762
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 762
    Par défaut
    Citation Envoyé par marco056 Voir le message
    - un copain sous Mac utilise "chardet" sans souci apparemment.
    Demandez lui de tester avec vos fichiers.

    Citation Envoyé par marco056 Voir le message
    - un petit script python pour encoder mes anciens fichiers qui était en latin1 m'aurait bien plu. Si ce n'est pas possible, tant pis !
    Si vous savez que le fichier est encodé "latin-1" pourquoi utiliser une heuristique pour retrouver une information que vous avez déjà?

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  5. #5
    Membre Expert
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 617
    Par défaut
    Citation Envoyé par wiztricks Voir le message
    Demandez lui de tester avec vos fichiers.
    C'est ce que j'ai fait, j'attends sa réponse.

    Citation Envoyé par wiztricks Voir le message
    Si vous savez que le fichier est encodé "latin-1" pourquoi utiliser une heuristique pour retrouver une information que vous avez déjà?

    - W
    L'idée, c'était de tester l'encodage de tous mes fichiers et de convertir avec iconv ceux qui étaient en latin-1.

  6. #6
    Membre Expert
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 617
    Par défaut
    Citation Envoyé par wiztricks Voir le message
    Demandez lui de tester avec vos fichiers.

    - W
    Voici mon problème résolu après une réinstallation de chardet.
    codage ISO-8859-2 et utf-8 obtenu sous linux et sous mac.
    Merci.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Petit soucis d'affichage avec javascript
    Par polymorphisme dans le forum Général JavaScript
    Réponses: 5
    Dernier message: 18/03/2011, 17h53
  2. petit soucis d'update avec reel
    Par psychosiffleur dans le forum Windows Forms
    Réponses: 6
    Dernier message: 26/02/2010, 14h04
  3. Petit soucie de sérialisation avec .net remoting
    Par teddyalbina dans le forum C#
    Réponses: 2
    Dernier message: 22/03/2008, 21h34
  4. Réponses: 5
    Dernier message: 05/11/2007, 23h30
  5. [Zip] petit soucis de variable avec "zip.lib.php"
    Par Giantrick dans le forum Bibliothèques et frameworks
    Réponses: 2
    Dernier message: 29/06/2007, 12h19

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo