et ICU ?
ca a l'air accepté par beaucoup, y compris Apple...
boost::regexp peut utiliser ICU, xerces aussi etc ....
Qu'en pensez-vous ?
et ICU ?
ca a l'air accepté par beaucoup, y compris Apple...
boost::regexp peut utiliser ICU, xerces aussi etc ....
Qu'en pensez-vous ?
Ha, ben j'ignorais complètement. C'est un peu étrange pour un système qui n'est même pas sensé le supporter du tout.Envoyé par loufoque
Quel système n'est pas sensé supporter quoi?Envoyé par zais_ethael
Les MP ne sont pas là pour les questions techniques, les forums sont là pour ça.
Linux, contrairement à windows qui est entièrement basé sur unicode depuis la version 2000.
Euh... De nos jours, pas mal de distribs Linux proposent l'UTF-8 comme charset par défaut lors de l'installation...
Et le choix de l'UTF-16 était peut-être un mauvais choix pour Windows (puisqu'on peut avoir plusieurs wchar_t pour un caractère, ce qui supprime l'accès instantané). Mais il fallait bien un minimum de compatibilité avec les versiosn précédentes en UCS-2...
SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parlé avant.
"Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
Apparently everyone. -- Raymond Chen.
Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.
De nouveau, wchar_t ce n'est pas pour unicode, mais pour tous les jeux larges et il y en a d'autres qu'unicode.Envoyé par zais_ethael
Quant à Linux, je ne sais pas d'où tu tiens tes informations... il y a du support interne à Linux pour unicode depuis le noyeau 2.0 releasé en 1996. Bon, il y a peu de choses dans le noyeau qui dépendent du codage des caractères et ça ne suffit pas pour être utilisable; le support pour le reste a été plus lent: le support dans la libc date si j'ai bonne mémoire de la 2.2 qui est sortie en 2000 si j'en crois les dates sur les fichiers dans gnu/glibc. Il y a des distributions Linux qui utilisent par défaut des locales UTF-8 depuis au moins 2002 et des utilisateurs qui le font depuis avant.
Les MP ne sont pas là pour les questions techniques, les forums sont là pour ça.
et ICU ?
Quel outil portable devrait-on utiliser pour gerer Unicode ?
Qt, ICU, iconv ?
je n'ai jamais utilisé. Ça m'a l'air d'être quelque chose aux possibilités larges.Envoyé par epsilon68
La première question est qu'est-ce que tu veux faire avec unicode. Suivant la réponse, il est possible mais peut vraissemblable que ce que les locales C++ suffisent -- à condition d'en avoir une qui supporte unicode -- où qu'il te faille ICU.Quel outil portable devrait-on utiliser pour gerer Unicode ?Qt, ICU, iconv ?
Les MP ne sont pas là pour les questions techniques, les forums sont là pour ça.
Est-ce que justement l'utf-16 n'est pas basé sur le fait d'avoir systématiquement 2 octets par caractère? L'utf-8 en utilisant 1, 2 ou 3.Envoyé par Médinoc
Edit: j'ai rien dit
en ce moment je fais des petits outils pour analyser le contenu de pages web,Envoyé par Jean-Marc.Bourguet
et d'autre pou de l'xml, et dans ces fichiers la il y a toujours des encoding utf-8 ou 16 voire meme 32
j'entends toujours parler d'unicode, et dans l'optique de comparer aussi boost et Qt (dans les differentes libs communes) il y a toujours les QString qui reviennent et l'unicode sous-jacent.
aussi entre autre pour Miles, ICU utilise aussi le COW
Je cherchais donc une alternative a Qt dans cette optique d'unicode et des fichiers a analyser.
a priori ICU est beaucoup utilisé, par boost::regex, par xerces ...
tiens libxml utilise iconv...
et unicode ne s'arrete pas au string, mais aussi aux expressions regulieres, au fichier d'entrée etc ...
a+
Ma question est jusqu'où tu veux profiter de tout unicode. Pas uniquement de la couverture large des caractères, mais de tout le reste. En particulier si tu as des choses en provenance de n'importe où, tu ne peux pas supposer que tes données sont normalisées (et si elles le sont, de toute manière tu ne connais pas la quelle des différentes formes normalisées d'unicode est utilisée). Dans ce cas, je prendrais ICU où ils ont l'air d'avoir pensé à plus de problèmes que je n'en connais (mais je ne suis pas spécialiste de la chose, en particulier je n'ai aucune pratique professionnelle, j'ai juste joué un peu et lu un peu plus).Envoyé par epsilon68
Les MP ne sont pas là pour les questions techniques, les forums sont là pour ça.
iconv c'est surtout pour les conversions entre les jeux de caractères. Pour le support unicode, y'a mieux.
Il semble que tu connaisses pas Glib::ustring, de glibmm.
C'est utilisé par gtkmm, libxml++...
C'est sous LGPL par contre.
Boost ftw
ustring est en UTF-8 et ne fait que ca, peut-etre alors la coupler avec iconv,Envoyé par loufoque
mais bon, je trouve que ca se joue plus finalement entre Qt et ICU.
LGPL n'est pas un probleme dans le cas d'un soft commercial, au contraire de GPL.
a+
J'ai essayé de compiler ICU sur mingw et cela ne marche pas...
et puis c'est vraiment un tres gros truc, peut-etre trop ...
en fait maintenant je crois que je me suis convaincu que Qt serait le meilleur choix pour Unicode jusqu'à l'interface graphique. Et j'utiliserais en priorité les libs de Qt plutot que d'autre libs.
si jamais dans quelques cas, il ne serait pas suffisant dans la gestion des caracteres (je ne sais pour quelle raison) il me reste libiconv.
a+
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager