-
parsing xml utf-8
slt,
j'aimerai savoir si dans un xml codé en UTF-8
(<?xml version="1.0" encoding="UTF-8"?>),
il est normal de se retrouvé avec des 'É' transformé en 'É' ?
ou bien est-on censé conservé le 'É' tel quel?
Sachant que si j'utilise la variable d'environnement LANG=french le 'É' reste en 'É' alors qu'avec LANG=fr_FR.UTF-8 les 'É' sont transformé en 'É' .
Merci d'avance.
-
C'est dépend de l'éditeur que tu utilises pour visualiser le fichier.
Il faut qu'il supporte l'utf-8 et reconnaisse le fichier en tant que tel.
Un navigateur devrait l'afficher correctement, je me rappelle qu'il existe une commande sous vi pour le forcer aussi.
Sinon cette page en parle bien, si tu comprends l'anglais: http://www.cl.cam.ac.uk/~mgk25/unicode.html