Enregistrement en UTF-16

Invité · 10/05/2014, 01h04

Bonjour,
Je travail sous visual studio, si je travail avec les wide string , est-ce que si j'enregistre mes sources en UTF-8 il y as un inconvénient ? J'aimerais bien enregistré mes sources en UTF-16 je pense que c'est l'encodage "Unicode - Page de codes 1200" mais je n'en suis pas sur,si oui y aura t-il le fameux BOM si j'enregistre avec cette encodage ?

Merci d'avance.

**stardeath** · 12/05/2014, 00h04

bonsoir,

Envoyé par yohann2008

mais je n'en suis pas sur,si oui y aura t-il le fameux BOM si j'enregistre avec cette encodage ?

oui, tu vas avoir un fichier en little endian avec le BOM 0xFFFE.

ensuite en général, je n'ai jamais de problème avec vs et l'encodage des caractères.

**Médinoc** · 12/05/2014, 14h39

Normalement sur tout Visual Studio >= 2005 je n'ai jamais vu de problème, que ce soit avec des sources UTF-16 ou UTF-8 (il me semble que les applis Microsoft mettent systématiquement une BOM; y compris les extensions des fonctions d'I/O de la C Run-Time Library).

**foetus** · 12/05/2014, 21h33

Ce qui est marrant, c'est que seul Microsoft semble utiliser le BOM

Wiki: Indicateur d'ordre des octets

**Médinoc** · 12/05/2014, 22h37

Ce n'est pas "marrant", c'est de la pure logique: On se retrouve avec des fichiers dans plusieurs encodages ASCII étendus différents beaucoup plus souvent sous Windows (Windows-1252 contre UTF-8, plus un peu d'UTF-16 dans certains cas) que sous Linux (où l'on n'a pratiquement que de l'ASCII pur et de l'UTF-8).
De plus, les fonctions d'accès aux fichiers POSIX, même en mode texte, ne propose pas d'extensions pour reconnaître et sauter la BOM (Les extensions de Microsoft permettent de reconnaître la BOM d'un fichier en le lisant, et faire la traduction convenablement selon qu'on lise/écrive avec les fonctions "wide" ou non), ce qui pose prétendument problème pour des opérations comme la concaténation de fichiers texte.

Invité · 13/05/2014, 13h30

ok moi qui voulait sans BOM , j'imagine qu'il est très déconseillé de l'enlever voir même obligatoire ?
La différence entre Unicode - Page de codes 1200 et Unicode (Big-Endian) - Page de codes 1201 c'est bien que le premier est en Little-Endian ?

Enregistrement en UTF-16

C++

Vue hybride

Discussions similaires

Partager

Partager