IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C++ Discussion :

Unicode est-il vraiment un probleme ?


Sujet :

C++

  1. #41
    Membre expérimenté
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    1 354
    Détails du profil
    Informations personnelles :
    Âge : 48
    Localisation : France

    Informations forums :
    Inscription : Juin 2006
    Messages : 1 354
    Points : 1 419
    Points
    1 419
    Par défaut
    et ICU ?
    ca a l'air accepté par beaucoup, y compris Apple...

    boost::regexp peut utiliser ICU, xerces aussi etc ....

    Qu'en pensez-vous ?

  2. #42
    Membre éprouvé
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    1 064
    Détails du profil
    Informations personnelles :
    Âge : 39
    Localisation : Belgique

    Informations forums :
    Inscription : Mars 2005
    Messages : 1 064
    Points : 1 053
    Points
    1 053
    Par défaut
    Citation Envoyé par loufoque
    Non seulement ça a déjà été dit dans ce sujet, mais en plus tu as des preuves vivantes que c'est faux. La taille de wchar_t varie d'un système à l'autre (2 octets sous MS Windows, 4 sous GNU/Linux).
    Ha, ben j'ignorais complètement. C'est un peu étrange pour un système qui n'est même pas sensé le supporter du tout.

  3. #43
    Expert éminent

    Inscrit en
    Novembre 2005
    Messages
    5 145
    Détails du profil
    Informations forums :
    Inscription : Novembre 2005
    Messages : 5 145
    Points : 6 911
    Points
    6 911
    Par défaut
    Citation Envoyé par zais_ethael
    C'est un peu étrange pour un système qui n'est même pas sensé le supporter du tout.
    Quel système n'est pas sensé supporter quoi?
    Les MP ne sont pas là pour les questions techniques, les forums sont là pour ça.

  4. #44
    Membre éprouvé
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    1 064
    Détails du profil
    Informations personnelles :
    Âge : 39
    Localisation : Belgique

    Informations forums :
    Inscription : Mars 2005
    Messages : 1 064
    Points : 1 053
    Points
    1 053
    Par défaut
    Linux, contrairement à windows qui est entièrement basé sur unicode depuis la version 2000.

  5. #45
    Expert éminent sénior
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 369
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 369
    Points : 41 519
    Points
    41 519
    Par défaut
    Euh... De nos jours, pas mal de distribs Linux proposent l'UTF-8 comme charset par défaut lors de l'installation...

    Et le choix de l'UTF-16 était peut-être un mauvais choix pour Windows (puisqu'on peut avoir plusieurs wchar_t pour un caractère, ce qui supprime l'accès instantané). Mais il fallait bien un minimum de compatibilité avec les versiosn précédentes en UCS-2...
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parlé avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

  6. #46
    Expert éminent

    Inscrit en
    Novembre 2005
    Messages
    5 145
    Détails du profil
    Informations forums :
    Inscription : Novembre 2005
    Messages : 5 145
    Points : 6 911
    Points
    6 911
    Par défaut
    Citation Envoyé par zais_ethael
    Linux, contrairement à windows qui est entièrement basé sur unicode depuis la version 2000.
    De nouveau, wchar_t ce n'est pas pour unicode, mais pour tous les jeux larges et il y en a d'autres qu'unicode.

    Quant à Linux, je ne sais pas d'où tu tiens tes informations... il y a du support interne à Linux pour unicode depuis le noyeau 2.0 releasé en 1996. Bon, il y a peu de choses dans le noyeau qui dépendent du codage des caractères et ça ne suffit pas pour être utilisable; le support pour le reste a été plus lent: le support dans la libc date si j'ai bonne mémoire de la 2.2 qui est sortie en 2000 si j'en crois les dates sur les fichiers dans gnu/glibc. Il y a des distributions Linux qui utilisent par défaut des locales UTF-8 depuis au moins 2002 et des utilisateurs qui le font depuis avant.
    Les MP ne sont pas là pour les questions techniques, les forums sont là pour ça.

  7. #47
    Membre expérimenté
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    1 354
    Détails du profil
    Informations personnelles :
    Âge : 48
    Localisation : France

    Informations forums :
    Inscription : Juin 2006
    Messages : 1 354
    Points : 1 419
    Points
    1 419
    Par défaut
    et ICU ?

    Quel outil portable devrait-on utiliser pour gerer Unicode ?
    Qt, ICU, iconv ?

  8. #48
    Expert éminent

    Inscrit en
    Novembre 2005
    Messages
    5 145
    Détails du profil
    Informations forums :
    Inscription : Novembre 2005
    Messages : 5 145
    Points : 6 911
    Points
    6 911
    Par défaut
    Citation Envoyé par epsilon68
    et ICU ?
    je n'ai jamais utilisé. Ça m'a l'air d'être quelque chose aux possibilités larges.

    Quel outil portable devrait-on utiliser pour gerer Unicode ?Qt, ICU, iconv ?
    La première question est qu'est-ce que tu veux faire avec unicode. Suivant la réponse, il est possible mais peut vraissemblable que ce que les locales C++ suffisent -- à condition d'en avoir une qui supporte unicode -- où qu'il te faille ICU.
    Les MP ne sont pas là pour les questions techniques, les forums sont là pour ça.

  9. #49
    Membre éprouvé
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    1 064
    Détails du profil
    Informations personnelles :
    Âge : 39
    Localisation : Belgique

    Informations forums :
    Inscription : Mars 2005
    Messages : 1 064
    Points : 1 053
    Points
    1 053
    Par défaut
    Citation Envoyé par Médinoc
    Et le choix de l'UTF-16 était peut-être un mauvais choix pour Windows (puisqu'on peut avoir plusieurs wchar_t pour un caractère, ce qui supprime l'accès instantané).
    Est-ce que justement l'utf-16 n'est pas basé sur le fait d'avoir systématiquement 2 octets par caractère? L'utf-8 en utilisant 1, 2 ou 3.

    Edit: j'ai rien dit

  10. #50
    Membre expérimenté
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    1 354
    Détails du profil
    Informations personnelles :
    Âge : 48
    Localisation : France

    Informations forums :
    Inscription : Juin 2006
    Messages : 1 354
    Points : 1 419
    Points
    1 419
    Par défaut
    Citation Envoyé par Jean-Marc.Bourguet
    La première question est qu'est-ce que tu veux faire avec unicode. Suivant la réponse, il est possible mais peut vraissemblable que ce que les locales C++ suffisent -- à condition d'en avoir une qui supporte unicode -- où qu'il te faille ICU.
    en ce moment je fais des petits outils pour analyser le contenu de pages web,
    et d'autre pou de l'xml, et dans ces fichiers la il y a toujours des encoding utf-8 ou 16 voire meme 32

    j'entends toujours parler d'unicode, et dans l'optique de comparer aussi boost et Qt (dans les differentes libs communes) il y a toujours les QString qui reviennent et l'unicode sous-jacent.

    aussi entre autre pour Miles, ICU utilise aussi le COW

    Je cherchais donc une alternative a Qt dans cette optique d'unicode et des fichiers a analyser.

    a priori ICU est beaucoup utilisé, par boost::regex, par xerces ...
    tiens libxml utilise iconv...

    et unicode ne s'arrete pas au string, mais aussi aux expressions regulieres, au fichier d'entrée etc ...

    a+

  11. #51
    Expert éminent

    Inscrit en
    Novembre 2005
    Messages
    5 145
    Détails du profil
    Informations forums :
    Inscription : Novembre 2005
    Messages : 5 145
    Points : 6 911
    Points
    6 911
    Par défaut
    Citation Envoyé par epsilon68
    en ce moment je fais des petits outils pour analyser le contenu de pages web,
    et d'autre pou de l'xml, et dans ces fichiers la il y a toujours des encoding utf-8 ou 16 voire meme 32
    Ma question est jusqu'où tu veux profiter de tout unicode. Pas uniquement de la couverture large des caractères, mais de tout le reste. En particulier si tu as des choses en provenance de n'importe où, tu ne peux pas supposer que tes données sont normalisées (et si elles le sont, de toute manière tu ne connais pas la quelle des différentes formes normalisées d'unicode est utilisée). Dans ce cas, je prendrais ICU où ils ont l'air d'avoir pensé à plus de problèmes que je n'en connais (mais je ne suis pas spécialiste de la chose, en particulier je n'ai aucune pratique professionnelle, j'ai juste joué un peu et lu un peu plus).
    Les MP ne sont pas là pour les questions techniques, les forums sont là pour ça.

  12. #52
    Expert confirmé
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Décembre 2003
    Messages
    3 549
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels

    Informations forums :
    Inscription : Décembre 2003
    Messages : 3 549
    Points : 4 625
    Points
    4 625
    Par défaut
    iconv c'est surtout pour les conversions entre les jeux de caractères. Pour le support unicode, y'a mieux.

    Il semble que tu connaisses pas Glib::ustring, de glibmm.
    C'est utilisé par gtkmm, libxml++...
    C'est sous LGPL par contre.
    Boost ftw

  13. #53
    Membre expérimenté
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    1 354
    Détails du profil
    Informations personnelles :
    Âge : 48
    Localisation : France

    Informations forums :
    Inscription : Juin 2006
    Messages : 1 354
    Points : 1 419
    Points
    1 419
    Par défaut
    Citation Envoyé par loufoque
    Il semble que tu connaisses pas Glib::ustring, de glibmm.
    C'est utilisé par gtkmm, libxml++...
    C'est sous LGPL par contre.
    ustring est en UTF-8 et ne fait que ca, peut-etre alors la coupler avec iconv,
    mais bon, je trouve que ca se joue plus finalement entre Qt et ICU.

    LGPL n'est pas un probleme dans le cas d'un soft commercial, au contraire de GPL.

    a+

  14. #54
    Membre expérimenté
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    1 354
    Détails du profil
    Informations personnelles :
    Âge : 48
    Localisation : France

    Informations forums :
    Inscription : Juin 2006
    Messages : 1 354
    Points : 1 419
    Points
    1 419
    Par défaut
    J'ai essayé de compiler ICU sur mingw et cela ne marche pas...
    et puis c'est vraiment un tres gros truc, peut-etre trop ...

    en fait maintenant je crois que je me suis convaincu que Qt serait le meilleur choix pour Unicode jusqu'à l'interface graphique. Et j'utiliserais en priorité les libs de Qt plutot que d'autre libs.

    si jamais dans quelques cas, il ne serait pas suffisant dans la gestion des caracteres (je ne sais pour quelle raison) il me reste libiconv.

    a+

Discussions similaires

  1. Réponses: 3
    Dernier message: 18/12/2006, 08h39
  2. Réponses: 7
    Dernier message: 06/11/2006, 20h43
  3. Est-ce vraiment légal ?
    Par pi-2r dans le forum Sécurité
    Réponses: 21
    Dernier message: 13/08/2006, 12h17
  4. [Reference][String][Integer] Qu'est ce vraiment ?
    Par ZeKiD dans le forum Langage
    Réponses: 17
    Dernier message: 24/01/2006, 17h22

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo