encodage utf-8, remplacer 'é' en 'é' dans une string pour un fichier mal codé
Bonjour,
j'ai fais un script de comparaison de fichiers, or il arrive que les fichiers soient encodés de façon pas terrible, je voudrai rendre mon script plus tolérant.
Voici le genre de chose sur laquelle je tombe:
'é' qui est en fait un 'é'
j'ai ouvert le fichier qui est bien en utf-8, comme ceci:
Code:
fichier_a = codecs.open(fichier_a_lien, encoding='utf-8')
mais notepad++ ne fait pas mieux.
en fait j'aimerai remplacer les 'é' par des 'é', mais comment?
merci d'avance