Publicité
+ Répondre à la discussion
Affichage des résultats 1 à 2 sur 2

Discussion: Help : Document XML

  1. #1
    Invité de passage
    Femme Profil pro wissam abb
    Étudiant
    Inscrit en
    octobre 2012
    Messages
    4
    Détails du profil
    Informations personnelles :
    Nom : Femme wissam abb
    Âge : 23
    Localisation : Maroc

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : octobre 2012
    Messages : 4
    Points : 0
    Points
    0

    Par défaut Help : Document XML

    Bonjour tout le monde,
    SVP concernant les document XML codé en unicode, mon prof m'a demandé de transformer les documents xml selon l'encodage (UTF-8, UTF-16, UTF-32) vers une suite binaire afin de bien observer la différence entre la translation des différents encodages d'Unicode !
    j'ai vraiment pas saisie son idée avez vous une idée ?

    Svp de l'aide, une suggestion !

    Merci d'avance

  2. #2
    Modérateur
    Avatar de polymorphisme
    Homme Profil pro Grégory Roche
    Publishing
    Inscrit en
    octobre 2009
    Messages
    1 437
    Détails du profil
    Informations personnelles :
    Nom : Homme Grégory Roche
    Âge : 41
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Publishing

    Informations forums :
    Inscription : octobre 2009
    Messages : 1 437
    Points : 2 096
    Points
    2 096

    Par défaut

    Bonjour,


    Le symbole de l'Euro '€' U+20AC, visible dans un éditeur XML, est codé, par exemple, par les trois octets xE2 x82 xAC = 11100010 10000010 10101100 en mémoire.

    La déclaration XML d'un document XML permet de définir son codage.
    Le symbole Euro aura une représentation interne au document XML fonction du codage.
    Représentation UTF-8 Signification
    0xxxxxxx 1 octet codant 7 bits
    110xxxxx 10xxxxxx 2 octets codant 8 à 11 bits
    1110xxxx 10xxxxxx 10xxxxxx 3 octets codant 12 à 16 bits
    11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 4 octets codant 17 à 21 bits

    Cette représentation varie donc entre l'UTF-8, UTF-16 et UTF-32.

    Le wiki propose un bonne documentation sur le sujet.
    Voir aussi le site du standard Unicode.
    Article : Installation de Cocoon
    Je ne réponds pas aux MP à caractère technique.

Liens sociaux

Règles de messages

  • Vous ne pouvez pas créer de nouvelles discussions
  • Vous ne pouvez pas envoyer des réponses
  • Vous ne pouvez pas envoyer des pièces jointes
  • Vous ne pouvez pas modifier vos messages
  •