[C# 2.0] Comment réaliser un encodage UTF-8 ?

**StormimOn** · 17/10/2006, 18h46

Bonjour,

je suis confronté à un problème d'encodage des plus étranges et j'espère que vous pourrez m'aider à y voir plus clair.

J'ai une application qui reçoit un fichier Xml à traiter. Ce fichier Xml est généré par une application tierce, et le fichier est au format ISO-8259-1. Pour traiter ce fichier je dois avant tout le réencoder en UTF-8. J'ai fait ca au plus simple car après tout, je ne pensais pas avoir de surprises

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
String content = File.ReadAllText(monFichier, Encoding.Default);
File.WriteAllText(monFichier, content, Encoding.UTF8);

Une fois réencodé, je passe ce fichier dans une moulinette qui utilise une API que l'on m'a fourni pour réaliser une signature électronique. Et c'est là que le problème se présente, j'ai en effet une erreur car l'API me dit que le fichier n'est pas au format UTF-8. L'erreur survient sur les caractères accentués, lorsque je consulte les fichiers de log de l'API.

J'ai alors testé une chose. J'ai mis de côté le fichier réencodé avec l'application. J'ai ouvert le fichier original (celui en ISO-8259-1 donc) avec PSPad, un petit éditeur de texte gratuit, et j'ai converti le fichier en UTF-8 à partir de là. En comparant, en héxadécimal, les deux fichiers UTF-8 j'ai constaté une différence. Le fichier UTF-8 généré en .Net possède 3 octets supplémentaires en début de fichier. De plus, le fichier converti avec PSPad est traité sans aucun problème par l'API.

Je ne comprends pas qu'il y ai une différence, car les pages de codes sont bien définies il me semble. Je devrais donc avoir le même résultat, et pourtant non.

Quelqu'un a-t-il eu à faire à ce type de mésaventure ?

**StormimOn** · 18/10/2006, 09h32

Bon, j'ai réussi à faire accepter le fichier par l'API, mais au prix d'une bidouille qui ne me plait guère.

Code C# :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
String content = File.ReadAllText(file.FullName, enc);
File.WriteAllText(file.FullName, content, Encoding.UTF8);
// TODO : bidouille pour faire passer l'encodage pour l'API
byte[] bytes = File.ReadAllBytes(file.FullName);
byte[] b = new byte[bytes.Length - 3];
for (int i = 3; i < bytes.Length; i++)
{
    b[i - 3] = bytes[i];
}
File.WriteAllBytes(file.FullName, b);
content = File.ReadAllText(file.FullName, enc);
ile.WriteAllText(file.FullName, content, Encoding.UTF8);

Ce que je ne comprends pas c'est que :
1. ca fonctionne, l'API prend bien mon fichier
2. dans le fichier original les accents (le é par exemple) sont remplacés (en Ã© par exemple)
3. une fois traité (appel de la méthode de signature de l'API), les accents sont de retours

Alors le problème vient-il de l'API que l'on m'a fourni ?

**JolyLoic** · 18/10/2006, 10h35

Il est courant d'ajouter au début d'un fichier texte quelques caractères permettant d'indiquer l'encoding de ce fichier. L'idée est que sans rien savoir d'un document, on puisse l'ouvrir dans le bon format. On comment par le lire octet par octet, puis dès qu'on a détecté l'encoding, on lit le reste du document avec le décodeur qui va bien. Le nombre et la valeur de ces caractères dépend de l'encodage.

Je pense que ton API ne connais pas cette convention, et butte dessus.

[C# 2.0] Comment réaliser un encodage UTF-8 ?

C#

Vue hybride

Discussions similaires

Partager

Partager