IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Entrée/Sortie Java Discussion :

[IO] : Pb de lecture d'un fichier au format UTF-8.


Sujet :

Entrée/Sortie Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2004
    Messages
    118
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2004
    Messages : 118
    Par défaut [IO] : Pb de lecture d'un fichier au format UTF-8.
    Bonjour,

    je dois lire un fichier encodé au format "UTF-8" pour conserver son contenu
    dans une chaine de caractères (String).

    Mon fichier s'affiche correctement (avec les accents) sous PsPad avec le format "UTF-8".

    Voici le contenu du fichier : «

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    <?xml version="1.0" encoding="UTF-8"?>
    <import dateHeureImport="2008-03-21T11:25:35+01:00" code="954">
        <evenements>
              <!--Gestion de la liste des événements-->
              <evenement codeEvenement="EV_ACCENT4">
                  <!--Description de l'événement EV_ACCENT-->                    
                  <libelleEvenement>Des accents : é à î è ' "</libelleEvenement>
                  <descriptionEvenement>Des accents : é à î è ' "</descriptionEvenement>
              </evenement>
        </evenements>
    </import>

    J'ai essayé d'écrire 2 solutions pour lire mon fichier :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
     1) String flux = FileUtils.readFileToString(fichier, "UTF-8");
    //(en utilisant l'API Apache commons-io)
     
     2) java.io.BufferedReader br = new java.io.BufferedReader(
        	new java.io.InputStreamReader(
            	new java.io.FileInputStream(file[0]),
            	"UTF-8"
            )
        );
     
        String ligne;
        StringBuilder str = new StringBuilder();
        int nbLignes = 1;
     
        while((ligne = br.readLine())!=null){
        	if (nbLignes == 1) {
        		str.append("\n");
        	}
     
        	str.append(ligne);
     
        	nbLignes++;
        }
     
        String flux = str.toString();

    Mais dans les deux cas, via le mode debug d'Eclipse et la fonctionnalité "inspect",
    je constate que les accents de mon fichier sont valorisés avec le caractère "?" :

    Voici le détail du fichier : «

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    <?xml version="1.0" encoding="UTF-8"?>
    <import dateHeureImport="2008-03-21T11:25:35+01:00" code="954">
        <evenements>
              <!--Gestion de la liste des ?v?nements-->
              <evenement codeEvenement="EV_ACCENT4">
                  <!--Description de l'?v?nement EV_ACCENT-->                    
                  <libelleEvenement>Des accents : ? ? ? ? ' " </libelleEvenement>
                  <descriptionEvenement>Des accents : ? ? ? ? ' "</descriptionEvenement>
              </evenement>
        </evenements>
    </import>
    ».

    C'est grave docteur ?

    Comment faire pour récupérer le contenu du fichier dans un String tout en gardant
    les accents ?

    Avez-vous une idée ?

    Merci d'avance pour votre aide,
    F.

  2. #2
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2004
    Messages
    118
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2004
    Messages : 118
    Par défaut
    personne n'a une idée ?

  3. #3
    Expert éminent
    Avatar de adiGuba
    Homme Profil pro
    Développeur Java/Web
    Inscrit en
    Avril 2002
    Messages
    13 938
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Java/Web
    Secteur : Transports

    Informations forums :
    Inscription : Avril 2002
    Messages : 13 938
    Billets dans le blog
    1
    Par défaut
    Salut,



    Ton code à l'air correct (mis à part que tu ne fermes pas le flux dans un finally... mais bon je suppose que tu n'as pas tout copier/coller).
    Quand à FileUtils.readFileToString() je ne l'ai jamais utilisé mais je ne pense vraiment pas qu'elle soit en cause...


    Es-tu vraiment sûr que le fichier est bien encodé en UTF-8 ? Je ne connais pas PsPad mais je suppose que tu dois pouvoir définir cela quelque part.

    Comme c'est un fichier XML, tu peux vérifier l'encodage du fichier avec un navigateur

    a++

  4. #4
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2004
    Messages
    118
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2004
    Messages : 118
    Par défaut
    Merci adiGuba,

    ton post m'a pas mal aidé.

    1) je n'avais pas mis de finally mais j'ai remis mon code avec FileUtils qui me semble plus propre et surtout moins long à écrire que le petit code à la main écrit rapidement.

    2) Après ouverture du fichier avec un navigateur (excellente idée, merci !), il s'avère que le fichier s'affiche mal. Il est donc mal écrit par une autre appli qui procède de la manière suivante, côté service : «
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
     
    Document doc = DocumentHelper.createDocument();
    doc.setXMLEncoding("UTF-8");
    // on renseigne le document
    ...
    ...
     
    // Encodage du document
    OutputFormat format = new OutputFormat();
    format.setEncoding(encodage);
    format.setNewLineAfterDeclaration(true);
    format.setNewlines(true);
    format.setIndent(true);
    format.setIndentSize(4);
     
    StringWriter out = new StringWriter();
    XMLWriter xmlWriter = new XMLWriter(out, format);
     
    try {
    	xmlWriter.write(document);
    } catch (IOException e) {
    	e.printStackTrace();		
    }
     
    // Si l'opération s'est correctement déroulée, on récupère la chaîne de caractères encodée.
    // A partir de la chaine encodée, on reconstitue un Document pour validation XSD.
     
    String xmlEncode = out.toString();
    Document documentEncode = null;
     
    try {
    	documentEncode = DocumentHelper.parseText(xmlEncode);
    } catch (DocumentException e) {
    	e.printStackTrace();		
    }
     
    // Validation XSD...
     
    String fluxXml = documentEncode.asXML();
    On transfère via HttpInvoker le flux Xml sous forme de String :

    Côté client :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
    String tab = ParamEvenementController.exporterXmlEvenements(listeSelection);
    return new StringBufferInputStream(tab);

    Avez-vous une idée ?

    Merci beaucoup,
    F.

Discussions similaires

  1. [SHELL] Lire un fichier au format UTF-16
    Par Cj_Dal dans le forum Shell et commandes GNU
    Réponses: 3
    Dernier message: 05/06/2013, 12h39
  2. Lecture d'un fichier windows en UTF-16LE
    Par stephanerain dans le forum C++
    Réponses: 5
    Dernier message: 20/01/2012, 12h29
  3. Lecture d'un fichier texte en UTF-8
    Par EL0807 dans le forum Access
    Réponses: 2
    Dernier message: 07/08/2006, 22h54
  4. [langage] Optimiser la lecture d'un fichier
    Par And_the_problem_is dans le forum Langage
    Réponses: 4
    Dernier message: 05/02/2003, 08h54
  5. [langage] Optimiser la lecture d'un fichier
    Par And_the_problem_is dans le forum Langage
    Réponses: 2
    Dernier message: 11/06/2002, 10h24

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo