IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Java Discussion :

Problème de character set


Sujet :

Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Profil pro
    Inscrit en
    Décembre 2009
    Messages
    265
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2009
    Messages : 265
    Par défaut Problème de character set
    Bonjour,

    J'ai un problème et depuis deux jours je tourne en rond pour le résoudre. Je ne suis pas certain que ce post doit être placé ici ou dans le forum MySql, car je ne sais pas exactement d'où vient ce problème.


    J'ai installé le package Apache POI pour lire un tableau de MS/WOrd (xxx.docx).
    Chaque cellule du tableau est écrite dans une colonne (définie en TEXT) d'une table MySQL.
    Comme l'encoding de word est CP1250 (enfin je crois) , je transforme (avant l'insert dans la table) le string avec :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    String wk    = new String( par.getBytes(), StandardCharsets.ISO_8859_1).trim();
    Si avec un outils quelconque, je visualise le contenu des colonnes, cela semble correct. Toutefois, si je regarde plus en détail (en valeur hexa) tous les apostrophes en réalité sont constitués de 3 digits : "E28099"
    Lorsque je sélectionne la ligne "SELECT * from ..." les apostrophes sont remplacées par des points d'interrogation.

    J'ai aussi essayé d'écrire le string sans changer le charset, mais cette fois, c'est presque tous les caractères français qui sont remplacés par des symboles non imprimables.
    J'ai fait des essais avec UTF_8, et autres possibilités pour la table : latin1, utf_8, cp1250, .. mais rien ne marche vraiment.

    Si vous avez des idées, merci d'avance.


    Gérard

  2. #2
    Membre Expert
    Avatar de professeur shadoko
    Homme Profil pro
    retraité nostalgique Java SE
    Inscrit en
    Juillet 2006
    Messages
    1 257
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 76
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : retraité nostalgique Java SE

    Informations forums :
    Inscription : Juillet 2006
    Messages : 1 257
    Par défaut
    Citation Envoyé par GérardMartinelli Voir le message
    Comme l'encoding de word est CP1250 (enfin je crois) ,
    ça ça dépend ... tu as essayé CP1252?

  3. #3
    Membre éclairé
    Profil pro
    Inscrit en
    Décembre 2009
    Messages
    265
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2009
    Messages : 265
    Par défaut
    Bien sûr j'ai essayé toutes les possibilités qui me paraissaient logiques : cp1250, cp1252, ASCII, UTF_8, UTF_16 etc.

    En fait avec cp1252, c'est le moins mal, seuls quelques caractères sont mal traduits, par exemple l'apostrophe 0x3F au lieu de 0x27 , quelques d'autres comme le "e dans l'o" (œuvre). Mais cela est peu courant.
    J'ai donc fait une petite routine pour résoudre mon problème d'apostrophe et cela marche plutôt bien.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
     
                           char[] wk3 = wk2.toCharArray();
    			char old = 0x3F;
     
    			for (int k=0; k<wk3.length; k++)
    			{
    				char b = wk3[k];
    				if (Character.compare(old, b) ==0) wk3[k]=  0x27 ;
    			}
    			wk2= new String(wk3);
    Merci quand même pour ta réponse, et la gentillesse que tu as eue de m'aider.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [ 11.2.0.3 ] Problème de character set ?
    Par ApprentiOracle dans le forum Administration
    Réponses: 0
    Dernier message: 18/12/2014, 13h27
  2. Problème de Character Set après UPGRADE
    Par agdid04 dans le forum Administration
    Réponses: 1
    Dernier message: 19/06/2012, 16h07
  3. problème de character set
    Par anouarm dans le forum Installation
    Réponses: 26
    Dernier message: 22/07/2010, 21h43
  4. Problème de CHARACTERS SET
    Par genio dans le forum Oracle
    Réponses: 6
    Dernier message: 29/11/2005, 14h38
  5. Problème avec accents et CHARACTER SET ISO8859_1
    Par kinda dans le forum InterBase
    Réponses: 13
    Dernier message: 30/10/2003, 15h49

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo