Solution : urllib/requests et caractères accentués
Bien le bonjour !
Je vous fais part de ma petite (re)trouvaille, j'ai régulièrement des difficultés pour obtenir les caractères accentués que je chope via urlopen ou autres... Les solutions proposées sur le net sont toutes les mêmes :
Code:
txt = reponse.decode('utf8')
Sauf que ça ne marche pas 99% du temps, alors voici ma solution :
Code:
1 2 3 4
| import requests as rq #Ou urllib si vous préférez
page = rq.get(url)
strPage=page.text.encode('utf8').decode('cp1252') |
A l'inverse pour pouvoir afficher correctement la variable dans certains interpréteurs il faudra faire :
Code:
nouvelle_variable = strPage.text.encode('cp1252').decode('utf8')
Bref, voilà j'espère tomber sur ma réponse dans 6 mois quand je me poserais à nouveau la question...