Conversion ISO8859-15 en UTF8

**edwin301** · 01/04/2012, 13h46

Bonjour,

J'extrait via une connexion JDBC un champ CLOB dans l'encoding ISO8859-15 pour convertir et générer un fichier XML dans l'encoding UTF8 à partir d'un traitement JAVA.

Le problème est le suivant : les majuscules accentuées ne sont pas correctement convertis : des carrés à la place.

Tous les autres accents sortent bien.

**tchize_** · 01/04/2012, 21h02

Ce n'est pas un problème d'encodage mais un problème de fonte si t'as des carrés à l'affiche. Vérifie les octes dans le fichier en question et je suis certain qu'ils doivent être corrects.

**thelvin** · 01/04/2012, 21h05

Envoyé par edwin301

Le problème est le suivant : les majuscules accentuées ne sont pas correctement convertis : des carrés à la place.

Tous les autres accents sortent bien.

Dans ce cas, c'est dans la BDD que les majuscules accentuées sont incorrectes. Elles ont été mal enregistrées, il n'y a plus rien à y faire.

Ou alors, tu fais un traitement bizarre et inutile entre BDD et XML.

Edit : Ah, ce que dit tchize est fort possible, en effet.

**tchize_** · 02/04/2012, 09h55

La réponse de thelvin est aussi probable. Un CLOB ce n'est pas un BLOB, c'est soumis aux règles d'encodage de la DB. D'ailleurs, avec un CLOB, normalement, tu n'a pas à connaitre "l'encodage", tu récupère un Reader directement via Clob.getCharacterStream()

**edwin301** · 02/04/2012, 11h45

Il ne s'agit pas seulement de l'affichage mais dans le fichier, j'ai bien des carrés pour le caractère 'É', alors que en BDD j'ai 'Ã?'.

La bdd est en character set iso 8859 et le fichier de sortie en UTF8.
La conversion iso8859-15 en utf8 ne fonctionne pas et ceci uniquement pour les majuscules accentuées.

Pour un CLOB tu n'as pas à connaitre l'encodage oui, mais quand tu veux un format de sortie différent (impératif), il faut savoir l'encoding d'entrée et de sortie :
new String(maChaine.getBytes("ISO8859-15"), "UTF8").
Sans faire cela, tous les accents (majuscule et miniscule) sortent avec des caractères étranges.

Un conseil sans bidouiller ?

**adiGuba** · 02/04/2012, 11h51

Salut,

Envoyé par edwin301

new String(maChaine.getBytes("ISO8859-15"), "UTF8").

Si tu fait cela c'est normal que tu n'obtiennes rien de bien !!!

Tu converties une chaine en byte encodé en ISO8859-15, que tu re-transformes en chaine en décodant de l'UTF-8.

Une chaine n'est pas associé à un encodage : en mémoire les chars sont encodés en UTF-16 !

Tu ne dois spécifier l'encodage que lorsque tu lis ou écris un flux binaire.

Bref supprimes cette ligne de code et ca devrait marcher bien mieux... s'il n'y a pas d'autres atrocité de ce genre.

a++

**unknow0** · 02/04/2012, 11h53

Envoyé par edwin301

new String(maChaine.getBytes("ISO8859-15"), "UTF8").

si ne me m'abuse c'est sa le problème, la se que tu fait c'est décoder de l'iso comme si c'était de UTF8.
la ou tu doit spécifier UTF8 c'est au moment d'écrire ton fichier de sortie.

EDIT: grilé en mieu en plus xD

**tchize_** · 02/04/2012, 11h54

CA:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

new String(maChaine.getBytes("ISO8859-15"), "UTF8").

Ca ne fait CERTAINEMENT pas une conversion, ça fait une soupe!

Tu prend ta chaine, tu la "sauve" (byte[]) en ISO8859-15 et puis tu lui dit de la relire en disant "ha mais tout compte fait, non j'ai stocké de l'UTF-8", ca n'a pas de sens.

Pour sauver en UTF-8, on crée un Writer avec de l'utf-8, et tu fais un write(laString) avec ça. Et tu n'a pas besoin de l'encodage d'origine:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
Reader r = clob.getReader();
OutputStream outputStreamFichier = new FileOutputStream(....);
Writer w = new OutputStreamWriter(outputStreamFichier,"UTF-8"));
char[] buffer = new char[2048];
int read = 0;
while ( (read=r.read(buffer)) > 0)
   w.write(buffer,0,read);

+ nettoyage / flush / fermeture etc

**edwin301** · 02/04/2012, 12h06

Je vois qu'y a de la bonne volonté.
Cependant si j'ai ajouté cette conversion c'est parceque le simple fait d'utiliser un writer avec l'encoding UTF-8
Writer w = new OutputStreamWriter(outputStreamFichier,"UTF-8"))

ne suffit pas pour traiter correctement les accents en minuscule.

Conversion ISO8859-15 en UTF8

Format d'échange (XML, JSON...) Java

Vue hybride

Discussions similaires

Partager

Partager