Problème avec les accents
Bonjour,
je souhaite créer un fichier texte contenant la liste des mots d'un texte. J'applique le code suivant :
Code:
1 2 3 4 5 6 7
|
f=open("myText.txt","r")
contenu=f.read()
f4=open("ListeMots.txt","w")
mylist = contenu.split()
f4.write(str(mylist)) |
Le fichier myText est en UTF-8.
S'il contient le texte suivant :
La première fois qu'Arthur vit Sidonie.
J'obtiens : ['La', 'première', 'fois', "qu'Arthur", 'vit', 'Sidonie']
Par contre si le fichier myText contient "ce jour-là" en plus :
La première fois qu'Arthur vit Sidonie ce jour-là.
J'obtiens : ['La', 'première', 'fois', "qu'Arthur", 'vit', 'Sidonie', 'ce', 'jour-lÃ']
Sauriez-vous svp comment résoudre ce problème? Merci pour votre aide.
Cordialement,
Arsène