IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

XML/XSL et SOAP Discussion :

Conversion XML UTF-8 sans BOM à ISO 8859-1


Sujet :

XML/XSL et SOAP

  1. #1
    Candidat au Club
    Inscrit en
    Novembre 2006
    Messages
    5
    Détails du profil
    Informations forums :
    Inscription : Novembre 2006
    Messages : 5
    Points : 4
    Points
    4
    Par défaut Conversion XML UTF-8 sans BOM à ISO 8859-1
    Bonjour,

    Je suis face à un problème de taille.. et je compte sur vos avis.

    J'ai un fichier xml encodé en utf8 sans BOM (en hexa il commence par 3c 3f 78 6d.... d'après mes recherches c'est un utf-8 sans BOM, sous notepad++ il est ANSI mais si je le converti en utf-8 sans BOM ça donne la même chose). Textuellement mon fichier xml ne contient pas d'encodage :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
    <?xml version="1.0"?>
    .........
    Mon but est de le transformer en ISO 8859-1.
    J'ai procédé comme suit:
    1/ J'ai ajouté les 3 caractères de BOM utf8 au début de mon fichier.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
    	char* BufferEncoder = (char*)malloc(3);
    	memset(BufferEncoder, 0, size);
    	for(int i=0;i<3;i++) BufferEncoder[i] ^= 0xaa;
    	BufferEncoder[0]=(char)0xef;
    	BufferEncoder[1]=(char)0xbb;
    	BufferEncoder[2]=(char)0xbf;
    /* Ajouter le BOM à mon xml sans son BOM d'origine.... etc */
    2/ Une fois le BOM encodé au début de mon fichier xml j'ai procédé à la transformation en iso 8859-1...

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
     
    // Création de pBuffer qui contient tout le fichier xml avec son BOM encodé en hexa (concaténation)
     
    int size = WideCharToMultiByte(28591 /*ISO-8859-1*/, 0,  pBuffer, -1, NULL, 0, NULL, 0);
    	if (size>0)
    	{
    		char* pBuffer2 = (char*)malloc(size);
    		memset(pBuffer2, 0, size);
    		WideCharToMultiByte(28591, 0,pBuffer,-1, pBuffer2, sizeNew, NULL, 0);
     
    /* Enregistrement du nouveau fichier xml encodé dans le buffer pBuffer2*/
    Je n'ai pas encore testé mon code mais j'aimerai avoir quand même vos avis. Pensez-vous que la transformation de cette manière est correcte?

    Y' a-t-il d'autres solutions plus simples?

    Merci d'avance!

  2. #2
    Membre actif
    Avatar de VforVincent
    Homme Profil pro
    Doctorant (EPUB 3.0)
    Inscrit en
    Avril 2011
    Messages
    115
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : Doctorant (EPUB 3.0)
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Avril 2011
    Messages : 115
    Points : 265
    Points
    265
    Par défaut
    Je suis peut être totalement HS, mais quand je veux convertir un fichier, j'utilise iconv... C'est d'ailleurs lui qui est derrière Notepad++ quand on fait une conversion (il me semble).

    Pour Windows, voici une page présentant iconv.

    "The power of the Web is in its universality.
    Access by everyone regardless of disability is an essential aspect."

    Tim Berners-Lee, W3C Director and inventor of the World Wide Web

  3. #3
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 551
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 551
    Points : 21 607
    Points
    21 607
    Par défaut
    Pareil.
    Sinon, pour programmer une conversion, je ne vois guère autre chose qu'utiliser le langage pour convertir des octets en une string à partir de l'encodage de départ, puis convertir la string en octets à l'aide de l'encodage d'arrivée. Je ne vois pas ce qu'un BOM viens f..aire ici, et de toute façon il me semble que ce devrait être plus simple. Ça l'est en Java et en python en tout cas.

    Mais surtout, la question de la conversion d'un charset à un autre n'est pas spécialement XML.
    Pour se remettre en sujet, un document XML est censé indiqué dans le prologue <?xml encoding=""?> quel est son encodage. Cela n'est facultatif que si l'encodage est utf-8, utf-16 ou implicitement connu par les acteurs de l'environnement où il est utilisé. Je suppose que le codage iso-8859-1 n'est aucun des trois, donc si tu convertis, il faut l'indiquer dans le prologue.
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

Discussions similaires

  1. Spool avec paramètre sur l'encodage en utf-8 sans BOM
    Par saidna123 dans le forum Oracle
    Réponses: 5
    Dernier message: 02/05/2013, 10h04
  2. Encodage d'un fichier en UTF-8 (sans bom)
    Par zakou33 dans le forum Général Conception Web
    Réponses: 2
    Dernier message: 04/03/2013, 13h15
  3. [XL-2003] Sauvegarder fichier csv en utf-8 sans BOM
    Par SpaceFrog dans le forum Macros et VBA Excel
    Réponses: 2
    Dernier message: 06/04/2010, 10h43
  4. <?xml version="1.0" encoding="ISO-8859-1" ?>: obligatoire?
    Par BradPitt dans le forum XML/XSL et SOAP
    Réponses: 1
    Dernier message: 25/11/2008, 12h45
  5. Réponses: 3
    Dernier message: 18/10/2008, 01h27

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo