Précédent   Forum des professionnels en informatique > C et C++ > C++ > Communauté > Contribuez > Traduction Penser en C++
Traduction Penser en C++ Forum de travail pour la traduction de "Penser en C++"
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 16/11/2006, 10h57   #1
Rédacteur
 
Inscription : juin 2003
Messages : 5 384
Détails du profil
Informations personnelles :
Âge : 30
Localisation : France

Informations forums :
Inscription : juin 2003
Messages : 5 384
Points : 6 234
Points : 6 234
Par défaut Traducteurs, relecteurs : a propos du format xml

Bonjour,
si vous téléchargez un fichier pour traduction ou relecture, vous constaterez qu'il s'agit d'un pseudo fichier xml. Pourquoi pseudo ? Parce que certaines balises ne sont pas équilibrées, en particulier la balise <section>.
Pourquoi ?
Parce que, à la base, l'ensemble du livre à traduire est contenu dans un seul et très gros fichier xml. Ce fichier xml de départ est un vrai xml valide, que nous utilisons chez developpez.com pour générer nos documents via un outil spécialisé.
Pour rendre la tâche de traduction possible, ce gros xml a été découpé en sous chapitres. Un (sous) chapitre, dans notre format interne xml, est identifié par la balise <section>. Ainsi, voici un exemple de chapitre avec 2 sous-chapitres:
Code xml :
1
2
3
4
5
6
7
 
<section id=1>
    <section id=1.0>
    </section>
    <section id=1.1>
    </section>
</section>
le découpage a été effectué au moyen d'un script simplissime, qui isole chaque sous <section> dans un nouveau fichier. Le résultat de ce découpage sur l'exemple ci-dessus produit:

sous chapitre 1.0:
Code xml :
1
2
3
4
 
<section id=1>
    <section id=1.0>
    </section>
sous chapitre 1.1:
Code xml :
1
2
3
4
 
    <section id=1.1>
    </section>
</section>

Vous comprenez donc mieux pourquoi les balises ne sont pas équilibrées dans les fichiers téléchargés, et surtout pourquoi il ne faut pas modifier cela.

Car lors du réassemblage des sous chapitres, tout se rééquilibrera correctement. De même, il ne faut pas modifier les identifiants des balises. Il y a aussi des balises html plus classiques : <b></b> pour mettre en gras, <i></i> pour mettre en italique, etc... Il faut aussi les conserver, puisque c'est le souhait de l'auteur.

Bref, le seule règle à retenir est:

le fichier traduit en français doit contenir exactement les mêmes balises que le fichier original en anglais. Toutes la balises, quelles qu'elles soient, doivent être préservées et conservées en l'état

Merci de votre compréhension, et bon courage
Aurelien.Regat-Barrel est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 16/11/2006, 11h39   #2
Expert Confirmé
 
Avatar de Eusebe
 
Inscription : mars 2006
Messages : 1 989
Détails du profil
Informations personnelles :
Âge : 34

Informations forums :
Inscription : mars 2006
Messages : 1 989
Points : 3 606
Points : 3 606
Au fait, puisque vous parlez de XML, une question que je me pose depuis le début, en quoi faut-il encoder ?

Jusqu'à présent, j'ai tout fait en UTF-8, mais comme "ce n'est pas vraiment du XML", que faut-il utiliser ?
Eusebe est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 16/11/2006, 11h49   #3
Rédacteur
 
Inscription : juin 2003
Messages : 5 384
Détails du profil
Informations personnelles :
Âge : 30
Localisation : France

Informations forums :
Inscription : juin 2003
Messages : 5 384
Points : 6 234
Points : 6 234
Les fichiers téléchargés sont en ISO-8859-1, donc il est péférable de conserver cet encodage.
Pour ceux qui ne savent pas de quoi on parle, ISO-8859-1 c'est l'encodage "normal" de base en français, ou chaque caractère fait 1 octet. C'est le mode ANSI de notepad, et à priori de votre éditeur favoris.
En UTF-8, on peut se retrouver avec plusieurs octets par caractères spécial (tels que les accents), ce qui explique que des fois vous voyez des caractères bizarres é è etc... dans un éditeur "normal" quand vous lisez un fichier UTF-8.
Aurelien.Regat-Barrel est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 07h13.


 
 
 
 
Partenaires

Hébergement Web