IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C Discussion :

Encodage caractères => Uniformisation


Sujet :

C

  1. #1
    Membre à l'essai
    Inscrit en
    Juillet 2005
    Messages
    17
    Détails du profil
    Informations forums :
    Inscription : Juillet 2005
    Messages : 17
    Points : 13
    Points
    13
    Par défaut Encodage caractères => Uniformisation
    Bonjour,

    Nous avons un projet de tri lexicographique utilisant une structure d'arbre. Jusque-là tout va bien, pour les mots anglais, cela fonctionne sans problème.

    Cependant, la langue française étant dotée de caractères accentués, les ennuis commencent.

    Effectivement, sur ma machine, je suis en encodage UTF-8, donc un "é" est codé sur 2 octets(191 + 169) donc la routine de comparaison pour insérer un mot dans l'arbre n'est plus si fastidieuse que ça.

    Je voulais donc savoir comment opérer d'une manière propre pour que le programme fonctionne correctement, quelque soit l'encodage local de l'utilisateur (UTF, ISO).

    Je me suis penché sur setlocale, mais à tâtons. De plus, il semble qu'il faut également faire attention à l'encodage utilisé dans le soft qui a servi à saisir les mots à trier.

    Si quelqu'un a quelques idées, je suis toute ouïe!

    Bonne journée.

  2. #2
    Expert éminent sénior
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 376
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 376
    Points : 41 544
    Points
    41 544
    Par défaut
    Utilise des WideChar, ils marchent en UTF-16 (Unicode 16-bits, donc) partout.

    type wchar_t etc. (regarde dans <wchar.h> les fonctions qui vont avec...)

    Pour la conversion par contre, je ne crois pas qu'il y ait quoi que ce soit de standard...
    Sous Windows, on utilise MultiByteToWideChar()...
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parlé avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

  3. #3
    Membre à l'essai
    Inscrit en
    Juillet 2005
    Messages
    17
    Détails du profil
    Informations forums :
    Inscription : Juillet 2005
    Messages : 17
    Points : 13
    Points
    13
    Par défaut
    Merci pour cette réponse.

    J'ai donc passé tout en Unicode.Malheureusement il ne me reconnaît pas les accents, et m'affiche deux magnifiques ? lorsqu'un mot en contient si j'utilise wprintf...

    Je vais essayer de trouver une solution,tout en restant attentif à vos remarques.

  4. #4
    Expert éminent sénior
    Avatar de Emmanuel Delahaye
    Profil pro
    Retraité
    Inscrit en
    Décembre 2003
    Messages
    14 512
    Détails du profil
    Informations personnelles :
    Âge : 67
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Retraité

    Informations forums :
    Inscription : Décembre 2003
    Messages : 14 512
    Points : 20 985
    Points
    20 985
    Par défaut
    Citation Envoyé par jinh
    Merci pour cette réponse.

    J'ai donc passé tout en Unicode.Malheureusement il ne me reconnaît pas les accents, et m'affiche deux magnifiques ? lorsqu'un mot en contient si j'utilise wprintf...

    Je vais essayer de trouver une solution,tout en restant attentif à vos remarques.
    Ceci fonctionne :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
     
    #include <wchar.h>
     
    #if 1
    /* OEM -> Console */
    #define a_grave L"\x0085"
    #else
    /* ANSI-> GUI */
    #define a_grave L"\x00E0"
    #endif
     
    int main(void)
    {
       wprintf (L"%s\n", a_grave L"a");
     
       return 0;
    }
    Ceci peut aider : http://emmanuel-delahaye.developpez....d/inc/ansi.itm
    Pas de Wi-Fi à la maison : CPL

  5. #5
    Membre à l'essai
    Inscrit en
    Juillet 2005
    Messages
    17
    Détails du profil
    Informations forums :
    Inscription : Juillet 2005
    Messages : 17
    Points : 13
    Points
    13
    Par défaut
    Cela ne fonctionne pas chez moi :/.

    Ca commence à me dépasser ces histoires d'encodage...

    Je rappelle:

    Encodage Local sous Linux : UTF-8
    Fichier texte : UTF-8
    Dans le source C: utilisation des types wchar_t et des fonctions associées.

Discussions similaires

  1. Linux/Tomcat/Firebird : Encodage caractères
    Par raphneve dans le forum Tomcat et TomEE
    Réponses: 1
    Dernier message: 04/10/2006, 11h02
  2. [vbs] fonction encodage caractères
    Par philippe123 dans le forum VBScript
    Réponses: 2
    Dernier message: 24/08/2006, 11h24
  3. Probléme encodage caractéres spéciaux MYSQL
    Par FoxLeRenard dans le forum Installation
    Réponses: 1
    Dernier message: 20/02/2006, 12h10
  4. Réponses: 1
    Dernier message: 02/02/2006, 23h12
  5. [JSP] Encodage caractère
    Par tscoops dans le forum Servlets/JSP
    Réponses: 2
    Dernier message: 08/02/2005, 09h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo