IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

GTK+ avec C & C++ Discussion :

Type d'encodage de fichiers texte [FAQ]


Sujet :

GTK+ avec C & C++

  1. #1
    Membre actif
    Profil pro
    Étudiant
    Inscrit en
    Novembre 2006
    Messages
    287
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2006
    Messages : 287
    Points : 208
    Points
    208
    Par défaut Type d'encodage de fichiers texte
    Bonsoir,

    Après d'infructueuses recherches sur le site de GTK, je me tourne vers vous :

    Existe-t-il une fonction retournant le jeu de caractères utilisé par un fichier texte ?
    exemple : utf8, unicode ou ASCII

    merci de vos réponses

  2. #2
    Rédacteur

    Avatar de gege2061
    Femme Profil pro
    Administrateur de base de données
    Inscrit en
    Juin 2004
    Messages
    5 840
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Juin 2004
    Messages : 5 840
    Points : 11 625
    Points
    11 625
    Par défaut
    Il n'existe pas de fonction pour ça, il faut tester un certains nombres de jeux de caractères (généralement ISO-8859-15 et UTF-8).

    Après certains fichiers, par exemple XML, contiennent le type d'encodage mais il n'est pas exclu que l'utilisateur ce soit trompé.

    J'ai un bout de code qui traine pour faire mais je ne l'ai pas sous le coude, je le posterai ce soir

  3. #3
    Membre actif
    Profil pro
    Étudiant
    Inscrit en
    Novembre 2006
    Messages
    287
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2006
    Messages : 287
    Points : 208
    Points
    208
    Par défaut
    merci, je vais tester de ce pas

  4. #4
    Rédacteur

    Avatar de gege2061
    Femme Profil pro
    Administrateur de base de données
    Inscrit en
    Juin 2004
    Messages
    5 840
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Juin 2004
    Messages : 5 840
    Points : 11 625
    Points
    11 625
    Par défaut
    Voici la version épurée de mon code :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    #include <stdlib.h>
    #include <string.h>
    #include <glib.h>
     
    static const gchar *charsets[] = {"UTF-8", "ISO-8859-15", NULL};
     
    static gboolean test_encoding (const gchar *path, const gchar *charset)
    {
      gboolean valid = FALSE;
     
      if (path != NULL)
      {
        gchar *content = NULL;
     
        g_file_get_contents (path, &content, NULL, NULL);
        if (content != NULL)
        {
          gchar *convert = NULL;
          gsize bytes_read = 0;
     
          convert = g_convert (content, -1, "UTF-8", charset, &bytes_read, NULL,
                               NULL);
          if (convert != NULL)
          {
            if (bytes_read == strlen (content))
            {
              valid = TRUE;
            }
            free (convert), convert = NULL;
          }
          free (content), content = NULL;
        }
      }
      return valid;
    }
     
    const gchar *encoding_get_charset (const gchar *path)
    {
      gint i;
     
      for (i = 0; charsets[i]; i++)
      {
        if (test_encoding (path, charsets[i]))
        {
          break;
        }
      }
      return charset[i];
    }

  5. #5
    Membre actif
    Profil pro
    Étudiant
    Inscrit en
    Novembre 2006
    Messages
    287
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2006
    Messages : 287
    Points : 208
    Points
    208
    Par défaut
    merci beaucoup

  6. #6
    Membre confirmé Avatar de Lunixinclar
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Juillet 2006
    Messages
    416
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juillet 2006
    Messages : 416
    Points : 489
    Points
    489
    Par défaut
    Salut,
    il existe une solution un peu moins élégante qui consiste à tester le fichier avec la commande file, par un tube. Au pire, le binaire "file" a un code source qui peut être obtenu (ou celui de gedit) mais là ça devient beaucoup plus complexe que le code ci-dessus.
    J'ai galéré un moment là-dessus ...

  7. #7
    Rédacteur

    Avatar de gege2061
    Femme Profil pro
    Administrateur de base de données
    Inscrit en
    Juin 2004
    Messages
    5 840
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Juin 2004
    Messages : 5 840
    Points : 11 625
    Points
    11 625
    Par défaut
    Citation Envoyé par Lunixinclar
    un code source qui peut être obtenu (ou celui de gedit) mais là ça devient beaucoup plus complexe que le code ci-dessus.
    J'ai galéré un moment là-dessus ...
    Mon code est inspiré de celui de gedit

    Tu as bien sûr quelques techniques pour augmenter les chances de trouver le bon encodage, comme récupérer la liste de tous les encodages disponibles sur le système ou encore te baser sur les spécificités des types de fichier (par exemple pour le XML, la première indique l'encodage).

    Mais mon code n'est pas optimisé et à chaque teste d'encodage, tu recharge le contenu du fichier, donc j'ai limité au plus courrant, suretout que c'est pour un éditeur de fichier XML donc si l'utilisateur ne renseigne pas correctement la première ligne, je veux bien l'aider mais y a des limites

Discussions similaires

  1. [Débutant] Comment connaitre le type d'encodage des fichiers textes ?
    Par saxrub dans le forum VB.NET
    Réponses: 1
    Dernier message: 30/03/2012, 11h26
  2. encodage dans fichier texte
    Par membreComplexe12 dans le forum MATLAB
    Réponses: 11
    Dernier message: 06/01/2012, 17h13
  3. encodage de fichier texte
    Par julien.63 dans le forum Général Python
    Réponses: 7
    Dernier message: 05/11/2009, 12h35
  4. Déterminer l'encodage du fichier texte
    Par ze.Ninus dans le forum Langage
    Réponses: 1
    Dernier message: 10/10/2006, 16h43

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo