Citation:
Envoyé par
Nico_stras
Bonjour, Je me pose des question au sujet de
l'encodage des caractères.
Ne t'en fais pas, ceux qui ne s'en posent pas n'ont vraisemblablement pas
compris le probleme.
Citation:
en C, en déclarant un caractère de type "char", 8 bits sont
alloués.
Au minimum.
Citation:
Si le caractère est compris entre 0 et 127, il se trouve dans la
table ASCII, donc aucun problème.
Pas necessairement. L'utilisation d'ASCII n'est en rien obligatoire. Il y
a des implementations qui utilisent EBCDIC.
Citation:
Par contre, les autres caractères (é, ç, ..., caractères exotiques,
...) possèdent un numéro unicode,
Oui. Mais il y a d'autres charsets qu'Unicode.
Citation:
et sont éventuellement présent dans une (ou plusieurs) tables de la
plage 128-255.
Unicode s'etend largement au dela de cette plage.
Citation:
Quel est l'encodage utilisé par le compilateur ?
Ca depend (du compilo, de l'OS, de la configuration, en particulier de la
locale utilisee par le compilateur -- gcc par exemple est capable d'en
gerer pas mal)
Citation:
Quel doit être l'encodage du code source dans lequel sont définis
des chaines de caractères ?
Ca depend de la locale utilisee quand on execute le programme.
Citation:
Quel est l'encodage utilisé lorsque l'on ouvre un fichier
texte?
Ca depend de l'editeur qui peut faire dependre ca de pas mal de chose (le
mien par exemple detecte un fichier LaTeX et utilise l'encodage indique par
le contenu LaTeX).
Citation:
Est-il possible (judicieux) d'utiliser dans toute le cycle de
développement (codage, compilation, exécution, ...) de l'UTF-8 ?
Mon point de vue actuel est qu'il ne faut plus utiliser des chars mais
uniquement des wchar_t en interne sauf cas particulier (genre systeme ou
toutes les locales n'utilisent pas le meme encodage pour les wchar_t, ca
existe) ou la, il faut reflechir un peu plus.
Quelques documents, tous incomplets, j'espere completer le premier pour
faire en sorte qu'il soit complet. Les deux autres devraient alors etre
soit fusionne dedans, soit y faire reference.
http://www.bourguet.org/v2/cs/charset/
http://www.bourguet.org/v2/clang/libc90/caracteres.html
http://www.bourguet.org/v2/clang/caracteres/