fonctions qui calculent le nombre d'octets d'un caractères

Version imprimable

27/06/2012, 17h03
Nouri2012

fonctions qui calculent le nombre d'octets d'un caractères

Bonjour,
Qeulqu'un à une idée sur une fonctions qui calculent le nombre d'octets d'un caractères
Merci d'avance.
Remarque : je parle d'un caractère et non pas d'une chaîne de caractère
27/06/2012, 17h09
oodini

Tu parles des char, wchar_t, etc ?
27/06/2012, 17h15
Nouri2012

je parle de char en fait j'utilise comme encodage UTF8
OS: ubutuen fait j'ai besoin de savoir la taille d'un séparateur, j'utilise comme
séparateut ¤ , ; .......
par exemple le caractère ¤ est code sur 2 bytes
ya t'il une fonction qui me permet d'avoir la taille de ¤ .
???
27/06/2012, 17h21
oodini

sizeof()
27/06/2012, 17h43
Nouri2012

A oublier sizeof car sizeof(¤) = 4, alors que ¤ code sur 2 bytes pour l'UTF8
tu peut teste sizeof("abc¤") = 6
par contre sizeof('¤') = 4????????????
27/06/2012, 18h59
mitkl

c'est normal car sizeof('a') retourne la taille que la constante 'a' et une constante est codée sur 4 octets d'où ton sizeof = 4
28/06/2012, 10h49
nowahn
Salut,

Tu peux aller voir du côté de glib:
Code:

1 2 3 4 5 #include <glib.h> /* ... */ char const* String="¤"; char* Next=g_utf8_offset_to_pointer(String, 1); int Bytes=Next-String;
mais c'est du C.
En C++, tu peux aller voir du côté de glibmm:
Code:

1 2 3 4 5 #include <glibmm/ustring.h> // ... Glib::ustring String="¤"; int Characters=String.length(); int Bytes=String.bytes();
Tu peux aussi aller voir du côté de iconv, ou si tu veux réinventer la roue, du côté de la définition de l'Utf8 pour te faire ta propre fonction.
Par contre, je pense que tu dois manipuler les caractêres UTF-8 en tant que chaînes de caractères ("…"), pas en tant que constante caractères('…') pour que les caractères multi-octets soient bien gérés.
28/06/2012, 11h36
oodini

Norme du C++, §6.4.4.4, paragraphe 10:

"An integer character constant has type int. The value of an integer character constant containing a single character that maps to a single-byte execution character is the numerical value of the representation of the mapped character interpreted as an integer."

Ton litéral chaîne est converti en int, pas en char, ou wchar_t, ou autre...
28/06/2012, 15h41
therwald

Reste à savoir pourquoi Nouri veut calculer la taille:
1) stockage en tant que char en C++=> réponse d'oodini
2) buffer pour stocker la représentation UTF-8 ==> glibmm apparament. Cependant, on peut se demander si dans ce cas il ne vaut pas mieux aller plus loin et utiliser la lib pour toutes les manipulations==>plus besoin de calculer la taille car la lib va gérer...
3):koi:
28/06/2012, 16h02
oodini

A lire la norme de C++11, je ne suis pas sûr que ce que j'ai indiqué plus haut soit encore rai en C++11.

En C++11, on peut d'ailleurs spécifier un encodage pour un litéral :

Code:

auto pouet = u8"pouet";

Le type sera const char *.

Pour l'instant implémenté sur gcc, mais pas sur Visual C++.