Impossible de lire correctement les accents d'un fichier
Bonjour,
J'ai récupéré dans bloque-note des données sur un site par un copier coller, par exemple:
Code:
1 2 3 4
| Bleu céleste (38, 196, 236)
Bleu céruléen (15, 157, 232)
Bleu céruléen (53, 122, 183)
Lavallière (143, 89, 34) |
Je les lis par ce programme:
Code:
1 2 3 4 5 6 7 8
| # -*- coding: windows-1252 -*-
from codecs import decode
fichier="D:\\Patrice\\Python\\tkinter\\Outils\\TesteLecture.txt"
en_lecture=open(fichier,'r')
lignes=en_lecture.readlines()
en_lecture.close()
for c in lignes:
print(c.strip().split("\n")) |
Impossible de récupérer correctement les accents et autres caractères 'spéciaux'. Voici ce que je récupère:
Code:
1 2 3 4
| ['Bleu céleste (38, 196, 236)']
['Bleu céruléen (15, 157, 232)']
['Bleu céruléen (53, 122, 183)']
['Lavallière (143, 89, 34)'] |
Sur internet on parle des méthodes encode et decode, mais je n'arrive pas à les trouver dans python.
L'encodage du site où j'ai récupéré les données est charset=windows-1252,
et pour bloc-note je trouve dans la barre d'état Windows(CRLF) et utf8.
Merci de m'aider à lire correctement ce type de fichier.