IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Java Discussion :

[Java6] InpuStreamReader : différence entre Charset et encodage


Sujet :

Java

  1. #1
    Pi2
    Pi2 est déconnecté
    Membre actif

    Profil pro
    Inscrit en
    Septembre 2005
    Messages
    134
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2005
    Messages : 134
    Points : 234
    Points
    234
    Par défaut [Java6] InpuStreamReader : différence entre Charset et encodage
    Bonjour,
    quelqu'un peut-il m'expliquer la différence qu'il y a entre l'utilisation d'un charsetDecoder ou directement du nom d'un charset pour lire un stream, svp?
    Plus explicitement, pourquoi les deux bouts de code ci-dessous ne donnent pas les mêmes résultats?

    1er cas :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
    Charset charset = Charset.forName("UTF-8");
    CharsetDecoder charsetDecoder = charset.newDecoder();
    BufferedReader input = new BufferedReader(new InputStreamReader(myInputStream, charsetDecoder));
    String line;
    while((line = input.readLine()) != null) {
        System.out.println(line);
    }
    2ème cas :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    BufferedReader input = new BufferedReader(new InputStreamReader(myInputStream, "UTF-8"));
    String line;
    while((line = input.readLine()) != null) {
        System.out.println(line);
    }
    Merci!
    Pi2.

  2. #2
    Expert éminent sénior
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 481
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 481
    Points : 48 806
    Points
    48 806
    Par défaut
    Que veux-tu dire par "résultat différent"? Normalement, tu devrais avoir les même résultat, que tu soit avec un string, un charset ou un charsetdecoder

  3. #3
    Pi2
    Pi2 est déconnecté
    Membre actif

    Profil pro
    Inscrit en
    Septembre 2005
    Messages
    134
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2005
    Messages : 134
    Points : 234
    Points
    234
    Par défaut
    Par résultats différents, je veux dire que, dans l'exemple de code que je donne, appliqué à un stream qui contient les mots suivants par exemple :

    Cimmerian–
    Jurassic
    /
    Cretaceous
    boundary
    and
    intraBerriasian


    Dans le premier cas, on obtient :
    java.nio.charset.MalformedInputException: Input length = 2
    at java.nio.charset.CoderResult.throwException(CoderResult.java:260)
    at sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:319)
    at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:158)
    at java.io.InputStreamReader.read(InputStreamReader.java:167)
    at java.io.BufferedReader.fill(BufferedReader.java:136)
    at java.io.BufferedReader.readLine(BufferedReader.java:299)
    at java.io.BufferedReader.readLine(BufferedReader.java:362)
    ... 41 more

    Dans le deuxième, on obtient :
    Cimmerian\ufffd
    \ufffd
    Jurassic
    /
    Cretaceous
    boundary

    Surprenant tout de même.
    Pi2.

  4. #4
    Expert éminent sénior
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 481
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 481
    Points : 48 806
    Points
    48 806
    Par défaut
    donne un code complet (avec les deux version) et attache un fichier de test que je teste ici. Ca m'a tout l'aire d'un bordel de ta jvm

  5. #5
    Pi2
    Pi2 est déconnecté
    Membre actif

    Profil pro
    Inscrit en
    Septembre 2005
    Messages
    134
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2005
    Messages : 134
    Points : 234
    Points
    234
    Par défaut
    En fait, quand je fais le test avec un fichier (FileInputStream), c'est ok.
    Mon problème apparaît quand l'inputStream provient d'un process comme suit :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    Process p = Runtime.getRuntime().exec(commandLine);
    InputStream myInputStream = p.getInputStream();
     
    puis la suite (présente dans mon premier message).

  6. #6
    Expert éminent sénior
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 481
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 481
    Points : 48 806
    Points
    48 806
    Par défaut
    t'es sur que ton process envoie de l'utf8? Peut-être que dans un cas y a une correction supplémentaire pour les caractère invalide.....

  7. #7
    Expert éminent sénior
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 481
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 481
    Points : 48 806
    Points
    48 806
    Par défaut
    trouvé

    Le streamreader fait probalement çà quand il construit son propre charsetdecoder:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    CharsetDecoder.onMalformedInput(CodingErrorsAction.REPLACE)

  8. #8
    Pi2
    Pi2 est déconnecté
    Membre actif

    Profil pro
    Inscrit en
    Septembre 2005
    Messages
    134
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2005
    Messages : 134
    Points : 234
    Points
    234
    Par défaut
    ah! oui! en effet ça doit être ça. Super merci!
    Pi2.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Différence entre un "bidouilleur" et un Pro ?
    Par christ_mallet dans le forum Débats sur le développement - Le Best Of
    Réponses: 290
    Dernier message: 28/11/2011, 10h53
  2. Réponses: 0
    Dernier message: 05/06/2009, 12h04
  3. [MySQL] Différence entre encodage des données et des tables ?
    Par Space Cowboy dans le forum PHP & Base de données
    Réponses: 1
    Dernier message: 02/05/2008, 12h51
  4. Différences entre jmp, jz, jnz, etc
    Par christbilale dans le forum Assembleur
    Réponses: 3
    Dernier message: 05/07/2002, 15h09
  5. Réponses: 3
    Dernier message: 07/05/2002, 16h06

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo