IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Traduction Penser en C++ Discussion :

Traducteurs, relecteurs : a propos du format xml


Sujet :

Traduction Penser en C++

  1. #1
    Expert confirmé

    Homme Profil pro
    pdg
    Inscrit en
    Juin 2003
    Messages
    5 756
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : pdg

    Informations forums :
    Inscription : Juin 2003
    Messages : 5 756
    Billets dans le blog
    3
    Par défaut Traducteurs, relecteurs : a propos du format xml
    Bonjour,
    si vous téléchargez un fichier pour traduction ou relecture, vous constaterez qu'il s'agit d'un pseudo fichier xml. Pourquoi pseudo ? Parce que certaines balises ne sont pas équilibrées, en particulier la balise <section>.
    Pourquoi ?
    Parce que, à la base, l'ensemble du livre à traduire est contenu dans un seul et très gros fichier xml. Ce fichier xml de départ est un vrai xml valide, que nous utilisons chez developpez.com pour générer nos documents via un outil spécialisé.
    Pour rendre la tâche de traduction possible, ce gros xml a été découpé en sous chapitres. Un (sous) chapitre, dans notre format interne xml, est identifié par la balise <section>. Ainsi, voici un exemple de chapitre avec 2 sous-chapitres:
    Code xml : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
     
    <section id=1>
        <section id=1.0>
        </section>
        <section id=1.1>
        </section>
    </section>
    le découpage a été effectué au moyen d'un script simplissime, qui isole chaque sous <section> dans un nouveau fichier. Le résultat de ce découpage sur l'exemple ci-dessus produit:

    sous chapitre 1.0:
    Code xml : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    <section id=1>
        <section id=1.0>
        </section>
    sous chapitre 1.1:
    Code xml : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
        <section id=1.1>
        </section>
    </section>

    Vous comprenez donc mieux pourquoi les balises ne sont pas équilibrées dans les fichiers téléchargés, et surtout pourquoi il ne faut pas modifier cela.

    Car lors du réassemblage des sous chapitres, tout se rééquilibrera correctement. De même, il ne faut pas modifier les identifiants des balises. Il y a aussi des balises html plus classiques : <b></b> pour mettre en gras, <i></i> pour mettre en italique, etc... Il faut aussi les conserver, puisque c'est le souhait de l'auteur.

    Bref, le seule règle à retenir est:

    le fichier traduit en français doit contenir exactement les mêmes balises que le fichier original en anglais. Toutes la balises, quelles qu'elles soient, doivent être préservées et conservées en l'état

    Merci de votre compréhension, et bon courage

  2. #2
    Membre Expert
    Avatar de Eusebe
    Inscrit en
    Mars 2006
    Messages
    1 992
    Détails du profil
    Informations personnelles :
    Âge : 47

    Informations forums :
    Inscription : Mars 2006
    Messages : 1 992
    Par défaut
    Au fait, puisque vous parlez de XML, une question que je me pose depuis le début, en quoi faut-il encoder ?

    Jusqu'à présent, j'ai tout fait en UTF-8, mais comme "ce n'est pas vraiment du XML", que faut-il utiliser ?

  3. #3
    Expert confirmé

    Homme Profil pro
    pdg
    Inscrit en
    Juin 2003
    Messages
    5 756
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : pdg

    Informations forums :
    Inscription : Juin 2003
    Messages : 5 756
    Billets dans le blog
    3
    Par défaut
    Les fichiers téléchargés sont en ISO-8859-1, donc il est péférable de conserver cet encodage.
    Pour ceux qui ne savent pas de quoi on parle, ISO-8859-1 c'est l'encodage "normal" de base en français, ou chaque caractère fait 1 octet. C'est le mode ANSI de notepad, et à priori de votre éditeur favoris.
    En UTF-8, on peut se retrouver avec plusieurs octets par caractères spécial (tels que les accents), ce qui explique que des fois vous voyez des caractères bizarres é è etc... dans un éditeur "normal" quand vous lisez un fichier UTF-8.

Discussions similaires

  1. Export de table au format XML
    Par Tieri dans le forum MS SQL Server
    Réponses: 2
    Dernier message: 09/09/2005, 11h39
  2. Lecture de fichier au format XML ??
    Par nico0007 dans le forum Langage
    Réponses: 1
    Dernier message: 07/07/2005, 15h40
  3. Format XML
    Par John Fullspeed dans le forum API, COM et SDKs
    Réponses: 5
    Dernier message: 01/10/2004, 14h28

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo