Bonjour à tous,
je tente de créer ma classe propre dérivée de Encoding afin de gérer proprement le charset Roman8 : http://demo.icu-project.org/icu-bin/...MIME&s=-&s=ALL
La table est bien sur un octet (max 0xFF) par contre les caractères qu'elle contient eux ne le sont pas forcément... (‾˚ŠšŸμ■)
Pour le décodage des caractères, j'ai mis dans un fichier le caractère ■, quand je le lis via :
J'accède à la fonction GetChars(byte[], int int, char[], int); avec le tableau de byte : { 226, 150, 160 } (qui correspond à ■) en UTF-8, ma question étant, comment je fais pour savoir que le tableau de byte est en UTF-8 pour pouvoir le décoder proprement? Dois-je considérer que c'est toujours le cas?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5 HPRoman8Encoding roman8 = new HPRoman8Encoding(); using (StreamReader reader = new StreamReader(f.FullName, roman8)) { string s = reader.ReadLine(); }
La question inverse se pose aussi...
pour toute aide concernant ce problème que j'ai du mal à élucider ...
Partager