Conversion UTF-8 -> EBCDIC et entities

**kij** · 14/01/2008, 12h44

Bonjour,

Je dois actuellement convertir des fichiers de données en EBCIDC et j'ai quelques soucis sur la conversion de certaines entity.

Actuellement, mon programmes recoit en entrée un fichier de données dans n'importe quel type de format (ca peut etre de l'UTF-8, de l'EBCDIC, de l'ASCII). J'ai donc une première phase qui permet de standardiser le format de ces données en UTF-8, puis une seconde qui convertie au format EBCDIC ces données.

Or il se trouve qu'en sortie, dans mes fichiers au format EBCDIC, j'ai des données corrompues (mal converties).
Par exemple, dans l'un des fichiers d'entrée j'ai au beau millieu d'une phrase, cette entité là : &#x2215
(symbole pour le '/') et en sortie je me retrouve avec un '.' au lieu d'avoir un '/'.

Mon problème est donc de réussir à garder intacte les données fournies en entrée. Comment pourrais-je faire pour détecter de telles erreurs, et convertir convenablement ce type d'entité ?
J'ai fais quelques recherches et j'ai trouvé la valeur &#47 en unicode pour le '/', et non 2215. Peut-être est ce donc normal que j'obtienne un '.' dans mon fichier converti. Mais dans ce cas là, comment interpréter de la même façon plusieurs entités ? Ou plutot comment faire pour que mon programme associe certaines entités à certaines valeur (ici remplacer &#x2215 par &x47) ?

Merci à ceux qui me viendront en aide.
Si je n'ai pas été assez clair faites le moi savoir

Conversion UTF-8 -> EBCDIC et entities

Format d'échange (XML, JSON...) Java

Mode arborescent

Discussions similaires

Partager

Partager