-
Help : Document XML
Bonjour tout le monde,
SVP concernant les document XML codé en unicode, mon prof m'a demandé de transformer les documents xml selon l'encodage (UTF-8, UTF-16, UTF-32) vers une suite binaire afin de bien observer la différence entre la translation des différents encodages d'Unicode !
j'ai vraiment pas saisie son idée avez vous une idée ?
Svp de l'aide, une suggestion !
Merci d'avance
-
Bonjour,
Le symbole de l'Euro '€' U+20AC, visible dans un éditeur XML, est codé, par exemple, par les trois octets xE2 x82 xAC = 11100010 10000010 10101100 en mémoire.
La déclaration XML d'un document XML permet de définir son codage.
Le symbole Euro aura une représentation interne au document XML fonction du codage.
Représentation UTF-8 Signification
0xxxxxxx 1 octet codant 7 bits
110xxxxx 10xxxxxx 2 octets codant 8 à 11 bits
1110xxxx 10xxxxxx 10xxxxxx 3 octets codant 12 à 16 bits
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 4 octets codant 17 à 21 bits
Cette représentation varie donc entre l'UTF-8, UTF-16 et UTF-32.
Le wiki propose un bonne documentation sur le sujet.
Voir aussi le site du standard Unicode.