IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C++ Discussion :

Format Unicode, Utf8, utf16


Sujet :

C++

  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Décembre 2013
    Messages
    27
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2013
    Messages : 27
    Par défaut Format Unicode, Utf8, utf16
    Bonjour, j'ai une petite question, on a un projet à rentre après ces vacances sur la conversion unicode/utf8/utf16 et inversement, donc 6 fonctions au total.

    Le prof veut qu'on vérifie la saisie du code de l'utilisateur, en soit y a rien de compliqué, mais comment peut-on connaitre le "minimum" et le "maximum" d'un code unicode ou utf8 ou utf16 ?

    Je m'explique, je pense pas me tromper en disant qu'un unicode vers Utf 16 ne peut pas avoir plus de 6 caractères (du moins on en a jamais vu) ? Mais quel est le code "minimal" valide pour un unicode ou plutôt quel est le premier caractère unicode (0000 je suppose ?) ? Et pareil pour utf8 et utf16 ? J'ai recherché sur wiki et les premières pages d'internet mais je trouve rien ou alors je comprend pas grand chose, ou alors je ne sais pas ce que je suis sensé trouver.

    Lorsque je fais des tests avec mon algorithme pour utf16, j'ai l'impression que le code unicode maximal pour l'unicode vers utf16 est 1FFFFF et par conséquent, le code maximal pour utf16Be vers unicode est: DBFFDFFF et pour utf16Le est: FFD8FFDF

    Est-ce bien cela ?

    Merci bonne journée et meilleurs voeux !

  2. #2
    Expert confirmé

    Inscrit en
    Novembre 2005
    Messages
    5 145
    Détails du profil
    Informations forums :
    Inscription : Novembre 2005
    Messages : 5 145
    Par défaut
    Citation Envoyé par Elradriel Voir le message
    Bonjour, j'ai une petite question, on a un projet à rentre après ces vacances sur la conversion unicode/utf8/utf16 et inversement, donc 6 fonctions au total.
    J'ai l'impression UTF8 et UTF16 sont des encodages d'Unicode. Je me demande si par Unicode tu ne veux pas dire UTF32.

    Le prof veut qu'on vérifie la saisie du code de l'utilisateur, en soit y a rien de compliqué, mais comment peut-on connaitre le "minimum" et le "maximum" d'un code unicode ou utf8 ou utf16 ?
    C'est pire, il y a des trous. Il y a une base de données (en fichiers textes) avec toutes les informations nécessaire: http://www.unicode.org/ucd/

    Voir aussi le reste du site d'Unicode.

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Décembre 2013
    Messages
    27
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2013
    Messages : 27
    Par défaut
    Bonsoir, alors si j'en crois ton lien, le dernier caractère unicode en date est : E01EF, le reste est réservé à un usage privée non officiel, que je suppose, je ne dois pas prendre en compte.

    Donc en fonction de ça, je peux trouver le caractère maximun en utf16 Be et Le.

    Après j'ai pu voir comme tu m'as dit qu'il y avait des trous dans les caractère unicodes, tu penses que je suis sensé mettre tous ça dans un fichier, et à chaque fois que l'utilisateur rendre un code unicode, aller lire toute la liste jusqu’à ce qu'on trouve ou non le caractère ? Ça me parait un peu lourd comme méthode non ?

    Surtout que dans ce cas, je vais devoir faire la même chose avec utf16 et 8 et je vois pas trop comment faire à part crée moi même le fichier texte avec le résultat de mon algorithme que je ferai tourner, en sachant que je ne dois rendre qu'un fichier bref je ne pense pas que ce soit la bonne solution.

    Pour ce qui est de l'utf32, j'en ai jamais entendu parler, mais je suppose au vu de ce qui est dit sur wiki, que ça revient à la même chose. (Quand je parle d'unicode c'est exactement le lien que tu m'as donné, donc je sais pas si utf32 revient au même)

  4. #4
    Membre éprouvé
    Profil pro
    Inscrit en
    Novembre 2004
    Messages
    2 766
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2004
    Messages : 2 766
    Par défaut
    J'en profite pour rappeler cette excellente source sur les flux.

Discussions similaires

  1. Unicode UTF8 ASCII UTF16 caractères accentués .
    Par PeD012 dans le forum VB.NET
    Réponses: 3
    Dernier message: 25/02/2012, 22h59
  2. [Système] Code source au format unicode
    Par bractar dans le forum Langage
    Réponses: 1
    Dernier message: 27/02/2007, 07h11
  3. Déterminer le Type fichier texte unicode, utf8?
    Par soazig dans le forum Autres Logiciels
    Réponses: 1
    Dernier message: 08/02/2007, 22h12
  4. convertir un text en format unicode
    Par mjava dans le forum Général Java
    Réponses: 4
    Dernier message: 18/07/2006, 16h51
  5. [i18n][utf8] Outils pour convertir iso8859-1 en unicode/utf8
    Par co2 dans le forum API standards et tierces
    Réponses: 5
    Dernier message: 07/11/2005, 09h56

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo