Impossible de lire correctement les accents d'un fichier

**Cemalatowilo** · 25/04/2020, 09h12

Bonjour,
J'ai récupéré dans bloque-note des données sur un site par un copier coller, par exemple:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
Bleu céleste (38, 196, 236)
Bleu céruléen (15, 157, 232)
Bleu céruléen (53, 122, 183)
Lavallière (143, 89, 34)

Je les lis par ce programme:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
# -*- coding: windows-1252 -*-
from codecs import decode
fichier="D:\\Patrice\\Python\\tkinter\\Outils\\TesteLecture.txt"
en_lecture=open(fichier,'r')
lignes=en_lecture.readlines()
en_lecture.close()
for c in lignes:
    print(c.strip().split("\n"))

Impossible de récupérer correctement les accents et autres caractères 'spéciaux'. Voici ce que je récupère:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
['Bleu cÃ©leste (38, 196, 236)']
['Bleu cÃ©rulÃ©en (15, 157, 232)']
['Bleu cÃ©rulÃ©en (53, 122, 183)']
['LavalliÃ¨re (143, 89, 34)']

Sur internet on parle des méthodes encode et decode, mais je n'arrive pas à les trouver dans python.
L'encodage du site où j'ai récupéré les données est charset=windows-1252,
et pour bloc-note je trouve dans la barre d'état Windows(CRLF) et utf8.
Merci de m'aider à lire correctement ce type de fichier.

**wiztricks** · 25/04/2020, 09h20

Salut,

L'encoding se précise à l'open: open(fichier,'r', encoding='utf-8')

- W

**Beginner.** · 25/04/2020, 09h37

Salut,

J'ai juste une remarque (tu as déjà eu la réponse à ta question) ne serait-ce pas mieux de lire le fichier ligne par ligne plutôt que de lire l'ensemble des lignes pour ensuite diviser cet ensemble en ligne.

**Cemalatowilo** · 25/04/2020, 10h53

Envoyé par Beginner.

Salut,

J'ai juste une remarque (tu as déjà eu la réponse à ta question) ne serait-ce pas mieux de lire le fichier ligne par ligne plutôt que de lire l'ensemble des lignes pour ensuite diviser cet ensemble en ligne.

merci wiztricks et beginner
ça fonctionne.

et pour répondre à beginner,
je ne sais pas lire ligne par ligne.

**wiztricks** · 25/04/2020, 11h20

Envoyé par Cemalatowilo

je ne sais pas lire ligne par ligne.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
en_lecture=open(fichier,'r',...)
for c in en_lecture:
      ....

Puis vous avez des bons tutos qu'on peut ouvrir aux chapitres qui parlent des fichiers.

- W

**Beginner.** · 25/04/2020, 12h25

Envoyé par Cemalatowilo

et pour répondre à beginner,
je ne sais pas lire ligne par ligne.

En fait j'ai lu trop vite, j'ai cru que tu divisais l'ensemble avec split mais c'est pas ça... Du coup oui lire l'ensemble des lignes comme tu le fais c'est bien finalement mais du coup split n'est pas utile sauf si tu tiens à afficher une liste au lieu d'une chaine... Pour afficher la chaine on peut faire juste ça print(c.strip()) à la place de print(c.strip().split("\n")) qui affiche une liste contenant la chaine...

**Cemalatowilo** · 25/04/2020, 13h47

Envoyé par Beginner.

En fait j'ai lu trop vite, j'ai cru que tu divisais l'ensemble avec split mais c'est pas ça... Du coup oui lire l'ensemble des lignes comme tu le fais c'est bien finalement mais du coup split n'est pas utile sauf si tu tiens à afficher une liste au lieu d'une chaine... Pour afficher la chaine on peut faire juste ça print(c.strip()) à la place de print(c.strip().split("\n")) qui affiche une liste contenant la chaine...

Ok, merci
je teste

Impossible de lire correctement les accents d'un fichier [Python 3.X]

Python

Vue hybride

Discussions similaires

Partager

Partager