Petit souci d'encodage avec le module chardet
Bonsoir,
Je souhaiterais utiliser le module "chardet" mais chez moi, cela ne fonctionne pas comme je le souhaiterais.
En effet, je dispose de 2 fichiers, l'un codé en latin1 (test-iso.tex), l'autre en utf-8 (testutf.tex). Or, les instructions suivantes me donnent GB2312 dans les 2 cas.
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13
| import chardet
f = open("test-iso.tex","rb")
fich_f=f.read()
code_f = chardet.detect(fich_f)['encoding']
print(code_f)
print()
g = open("test-utf.tex","rb")
fich_g=g.read()
code_g = chardet.detect(fich_g)['encoding']
print(code_g) |
Quelqu'un a une idée ?