Parser un fichier XML contenant des accents
Bonjour, je cherche à parser un fichier XML contenant des accents. J'éprouve des problèmes d'encodage et je trouve assez difficilement des informations sur le net. J'utilise pour le moment minidom pour parser un fichier encodé en ISO-8859-1. Voici mon code:
Code:
1 2 3 4 5 6 7 8 9 10 11
|
try:
fileXML = open(fichierXML, 'r+')
fileXML = fileXML.read()
fileXML = u'%s'.encode(fichierEncodXML)%fileXML
except IOError, message:
print >> sys.stderr, 'File could not be opened:', message
raw_input( '\nAppuyer sur une touche...' )
sys.exit( 1 )
document = xml.dom.minidom.parseString(fileXML) #on parse le document |
Et voici le code d'erreur:
Code:
1 2 3 4 5 6 7 8 9 10 11 12
|
Traceback (most recent call last):
File "profils.py", line 45, in <module>
document = xml.dom.minidom.parseString(fileXML) #on parse le document
File "C:\Python25\lib\xml\dom\minidom.py", line 1923, in parseString
return expatbuilder.parseString(string)
File "C:\Python25\lib\xml\dom\expatbuilder.py", line 940, in parseString
return builder.parseString(string)
File "C:\Python25\lib\xml\dom\expatbuilder.py", line 223, in parseString
parser.Parse(string.decode('ISO-8859-1'), True)
UnicodeEncodeError: 'ascii' codec can't encode characters in position 62-63: ord
inal not in range(128) |
J'ai déjà essayé pas mal de combinaisons avec les fonctions encode et decode mais rien ne fonctionne :s Quelqu'un pourrait-il m'aider svp?
Merci beaucoup!!