Là j'ai un peu de mal à suivre.
Soit le caractère 128 == 0x80 = 10000000 == 'ç' .
Le bit de poids est 1, pourtant c'est un caractère ASCII page de code Latin 1 (je suppose)
Il me semble que la notion d'Unicode s'intercale entre celle d'UTF-8 et de code ASCII. Je ne me suis jamais penché en détail sur ce sujet, je n'en ai pas eu l'occasion, mais j'ai relu mon bouquin.
Je pense que la meilleure solution pour Imad-Ing est de fait une impression, juste après la lecture d'une ligne du fichier XML, et avant tout traitement.
Je pense aussi qu'un sizeof(<ce qu'on lit>, ou strlen ou je ne sais quoi, permettrait d'être sûr du nombre d'octets lus et imprimés.
@ Imad-ing
N'hésitez pas à m'envoyer un bout de votre XML.
Partager