IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C# Discussion :

Problème Streamreader accents


Sujet :

C#

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Profil pro
    Inscrit en
    Septembre 2009
    Messages
    64
    Détails du profil
    Informations personnelles :
    Localisation : France, Bas Rhin (Alsace)

    Informations forums :
    Inscription : Septembre 2009
    Messages : 64
    Par défaut Problème Streamreader accents
    Bonjour à tous !

    J'ai un petit bout de code qui me permet de récupérer le contenu d'un fichier csv que voilà :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
     
    public static List<string[]> ExtractFile(string csvFile)
            {
                List<string[]> result = new List<string[]>();
                StreamReader streamReader = new StreamReader(csvFile, Encoding.UTF8,);
     
                while (streamReader.Peek() != -1)
                {
                    result.Add(streamReader.ReadLine().Split(';'));
                }
     
                return result;
            }
    Mon souci est que certains champs possèdent des accents de ce genre : Bartók Béla. Dans la liste de tableaux de string retournée par cette fonction, les accents sont remplacés par le symbole rectangulaire bien connu de ceux qui ont déjà goûté aux problèmes d'encodage.

    J'ai essayé de donné un encoding en UTF-7 8 32 UNICODE, bref tous les encodages que l'on peut mettre en paramètre au Streamreader, rien.

    Quelqu'un aurait-il une idée ?

    Merci d'avance pour toutes les réponses !

  2. #2
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2004
    Messages : 19 875
    Par défaut
    Je soupçonne que le problème n'est pas au niveau de la lecture du fichier mais plutôt au niveau de ce que tu fais des chaines ensuite... Tu as essayé de déboguer en pas à pas pour voir si les lignes lues dans le fichier sont correctes ? A quel niveau tu observes que les accents sont mal interprétés ? A l'affichage ?

    Si tu peux, poste un des fichiers qui posent problème

  3. #3
    Membre chevronné
    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2009
    Messages
    317
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : Belgique

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : Finance

    Informations forums :
    Inscription : Février 2009
    Messages : 317
    Par défaut
    Plop, c'est peut être que l'encoding utilisé lors de l'initialisation de ton StreamReader ne correspond pas à celui de ton fichier, tu peux essayer :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
    Encoding encode = GetEncoding(opendia.FileName);
    TextReader read = new StreamReader(opendia.FileName, encode);
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
     
    private Encoding GetEncoding(string CheminFichier)
     {
         Encoding enc = null;
         FileStream file = new FileStream(CheminFichier, FileMode.Open, FileAccess.Read, FileShare.Read);
         if (file.CanSeek)
         {
             byte[] bom = new byte[4]; // Get the byte-order mark, if there is one
             file.Read(bom, 0, 4);
             if (bom[0] == 0xef && bom[1] == 0xbb && bom[2] == 0xbf) // utf-8
             {
                enc = Encoding.UTF8;
             }
             else if ((bom[0] == 0xff && bom[1] == 0xfe) || // ucs-2le, ucs-4le, and ucs-16le
             (bom[0] == 0 && bom[1] == 0 && bom[2] == 0xfe && bom[3] == 0xff)) // ucs-4
             {
                enc = Encoding.Unicode;
             }
             else if (bom[0] == 0xfe && bom[1] == 0xff) // utf-16 and ucs-2
             {
                enc = Encoding.BigEndianUnicode;
             }
             else // ANSI, Default
             {
                enc = Encoding.Default;
             }
             // Now reposition the file cursor back to the start of the file
             file.Seek(0, SeekOrigin.Begin);
         }
         else
         {
         // The file cannot be randomly accessed, so you need to decide what to set the default to
         // based on the data provided. If you're expecting data from a lot of older applications,
         // default your encoding to Encoding.ASCII. If you're expecting data from a lot of newer
         // applications, default your encoding to Encoding.Unicode. Also, since binary files are
         // single byte-based, so you will want to use Encoding.ASCII, even though you'll probably
         // never need to use the encoding then since the Encoding classes are really meant to get
         // strings from the byte array that is the file.
     
         enc = Encoding.Default;
         }
         file.Close();
         return enc;
     }

  4. #4
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2004
    Messages : 19 875
    Par défaut
    A priori StreamReader fait déjà quelque chose comme ça pour détecter l'encodage s'il n'est pas spécifié...

    Mais de toutes façons cette technique n'est pas infaillible : le BOM n'est pas obligatoire, du moins en UTF-8...

  5. #5
    Membre chevronné
    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2009
    Messages
    317
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : Belgique

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : Finance

    Informations forums :
    Inscription : Février 2009
    Messages : 317
    Par défaut
    Citation Envoyé par tomlev Voir le message
    A priori StreamReader fait déjà quelque chose comme ça pour détecter l'encodage s'il n'est pas spécifié...
    Pas toujours, j'ai déjà été obligé d'utiliser cette fonction aussi non les caractères étaient mal interprétés :/

  6. #6
    Expert confirmé Avatar de Graffito
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    5 993
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 993
    Par défaut
    Essaye avec
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    new StreamReader(csvFile, Encoding.GetEncoding("iso-8859-1");
    ou
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    new StreamReader(csvFile, Encoding.GetEncoding(1252);

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. petit problème d'accent
    Par No_SenS dans le forum MS SQL Server
    Réponses: 6
    Dernier message: 11/04/2005, 13h10
  2. Problèmes d'accent avec une connexion ODBC et ADO
    Par michael.jacques dans le forum Bases de données
    Réponses: 3
    Dernier message: 10/03/2005, 15h36
  3. Réponses: 3
    Dernier message: 25/02/2005, 20h46
  4. [XSLT] application d une xslt et problème d'accents
    Par lanfeust23 dans le forum Format d'échange (XML, JSON...)
    Réponses: 3
    Dernier message: 26/07/2004, 13h08
  5. Problème avec accents et CHARACTER SET ISO8859_1
    Par kinda dans le forum InterBase
    Réponses: 13
    Dernier message: 30/10/2003, 15h49

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo