IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C++ Discussion :

Décodage : de l'UTF-8 vers Unicode ou ISO-8859-1


Sujet :

C++

  1. #1
    Membre du Club
    Inscrit en
    Novembre 2006
    Messages
    157
    Détails du profil
    Informations forums :
    Inscription : Novembre 2006
    Messages : 157
    Points : 69
    Points
    69
    Par défaut Décodage : de l'UTF-8 vers Unicode ou ISO-8859-1
    Bonjour,

    Je ne parviens pas à trouver comment décoder une chaine UTF-8 pour obtenir une chaine Unicode ou ISO-8859-1.

    Voici un exemple de chaine UTF-8 :
    qualité de =?UTF-8?B?cXVhbGl0w6kgZGUgbCdhaXIgZHUgMTIvMDQvMjAwNw==?=
    Qui se traduirait en :
    qualité de l'air du 12/04/2007
    Savez-vous comment obtenir la table de correspondance entre ces étranges caractères UTF-8 et les caractères Unicode traditionnels ?
    Voilà que je cherche depuis un long moment sans trouver d'élément de réponse qui puisse m'aider.

    Concrètement, je cherche à trouver l'algo qui va me convertir "cXVhbGl0w6kgZGUgbCdhaXIgZHUgMTIvMDQvMjAwNw==" en "l'air du 12/04/2007", sachant que le "B?" de "=?UTF-8?B?" signifie qu'en plus d'être ecodé en UTF-8, il y a un surencodage en Base64, mais ca je sais le gérer.

  2. #2
    Expert éminent sénior
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 369
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 369
    Points : 41 519
    Points
    41 519
    Par défaut
    Déjà, commence par convertir ta chaîne Base64 en UTF-8.

    Ensuite, tu trouveras sur internet (quelque part, je dois déjà avoir posté le lien sur le forum) les algos permettant de convertir UTF-8 en un autre format unicode (UTF-16 ou UTF-32/UCS-4).

    Quant à l'ISO-8859-1, c'est très facile à obtenir à partir d'UTF-16 ou UTF-32/UCS-4 : Tout caractère dont le code (non-signé) est inférieur à 256 est un caractère ISO 8859-1. Pour les autres caractères, tu peux les sauter, les remplacer par des points d'interrogation, etc.
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parlé avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

  3. #3
    Membre du Club
    Inscrit en
    Novembre 2006
    Messages
    157
    Détails du profil
    Informations forums :
    Inscription : Novembre 2006
    Messages : 157
    Points : 69
    Points
    69
    Par défaut
    Merci, voilà qui devrait mieux orienter ma recherche

  4. #4
    Membre éclairé

    Profil pro
    Inscrit en
    Septembre 2006
    Messages
    717
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2006
    Messages : 717
    Points : 858
    Points
    858
    Par défaut
    Ceci devrait également t'aider http://www.w3.org/XML/1998/01/xmlrecode.c (attention il y a quelques erreurs dans ce code).

  5. #5
    Futur Membre du Club
    Profil pro
    Inscrit en
    Décembre 2005
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2005
    Messages : 15
    Points : 9
    Points
    9
    Par défaut pour info
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
     
    string lsValue = "=?utf-8?B?c3ViIGplY3Q=?=";
    const string base64Flag = "=?utf-8?B?";
     
    lsValue = lsValue.Substring(base64Flag.Length, lsValue.Length - base64Flag.Length - 2);
     
    lsValue = System.Text.Encoding.UTF8.GetString(Convert.FromBase64String(lsValue));
    et hop !

  6. #6
    Expert éminent sénior
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 369
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 369
    Points : 41 519
    Points
    41 519
    Par défaut
    Oui, enfin ça, c'est du .Net, et même pas en C++...
    Code C++/CLI : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    String^ lsValue = L"=?utf-8?B?c3ViIGplY3Q=?=";
    const String^ base64Flag = L"=?utf-8?B?"; //J'ai un doute sur le const
     
    lsValue = lsValue->Substring(base64Flag->Length, lsValue->Length - base64Flag->Length - 2);
     
    lsValue = System::Text::Encoding::UTF8->GetString( Convert::FromBase64String(lsValue) );
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parlé avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [2008R2] Export données vers le format ISO-8859-5
    Par Maren00 dans le forum MS SQL Server
    Réponses: 4
    Dernier message: 29/05/2013, 10h43
  2. wince Unicode to iso-8859-1
    Par midou256 dans le forum C#
    Réponses: 1
    Dernier message: 27/10/2011, 19h15
  3. Conversion Ansi vers Unicode
    Par FamiDoo dans le forum C++
    Réponses: 10
    Dernier message: 10/08/2006, 14h31
  4. cyrilique vers unicode
    Par oFlex dans le forum Algorithmes et structures de données
    Réponses: 4
    Dernier message: 08/07/2006, 01h21
  5. conversion iso-8859-1 => UTF-8 (unicode)
    Par pierru666 dans le forum Général JavaScript
    Réponses: 5
    Dernier message: 30/05/2006, 22h17

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo