Bonjour,
Je me permets de vous soumettre un petit problème d'encodage ! J'ai lu des tas de pages/forum sur internet, mais entre les différentes versions de python et les différents encodages, je commence à m'y perdre.
Je travaille sous Python 3.3 et windows 7. Je cherche à lire des fichiers textes (quand je les ouvres sous windows, aucun problème de lecture). Quand je les ouvre avec Python, plein de problèmes : beaucoup de caractères ne sont pas lus correctement, et les fichiers sont bourrés de \u0327, \u2013,... par exemple. Si j'essaye
je récupère b'\xe2\x80\x93' pour '\u2013'
Code : Sélectionner tout - Visualiser dans une fenêtre à part monText.encode('utf-8', 'replace')
Si j'essaye 'Latin-1' ou sys.stdout.encoding à la place de 'utf-8' j'obtiens '?'
Dans ma configuration, sys.stout.encoding vaut 'cp850'.
Bref la lecture des fichiers est très compliquée !
Merci pour votre aide !
Partager