IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SL & STL C++ Discussion :

std::ifstream avec path contenant des caractères non-ascii


Sujet :

SL & STL C++

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Avril 2005
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations forums :
    Inscription : Avril 2005
    Messages : 15
    Points : 16
    Points
    16
    Par défaut std::ifstream avec path contenant des caractères non-ascii
    Bonjour tout le monde,

    Vous êtes mon dernier espoir avant mon probable suicide du aux locales/encodages de caractères

    Mon problème est simple :

    Imaginons que j'ai un fichier dont le nom, ou le chemin, contienne des caractères non-ascii, par exemple du japonais, du grec, du russe ... Pour l'example on va dire que mon fichier s'appelle 疑問.dat.

    Ce fichier est binaire, c'est simplement son chemin qui contient des caractères non-ascii. Sous Linux, si je fais :

    std::ifstream ifs("疑問.txt"); et bien je peux ouvrir le fichier, aucun soucis. Dans ma vraie application, ce fichier est choisi par l'utilisateur par un file dialog (QFileDialog du framework Qt ). Je récupère en retour un QString nommé filepath, et en faisant simplement std::ifstream ifs(filepath.toUtf8()), ça fonctionne encore.
    A mon avis ça marche car ma distribution Linux utilise par défaut l'UTF-8.

    Le problème, c'est sous Windows, ou aucun des 2 streams construits au dessus ne permet d'ouvrir le fichier ! Je pense que c'est un problème de locale, apparemment ifs.getloc().name() retourne "C".

    En fait j'ai beaucoup de mal à saisir tous les concepts de l'internationalisation en C++, les encodages, les locales, UTF-8 ... Pour résoudre un problème il faut déjà le comprendre, mais je ne suis pas sur de comprendre ce qu'il se passe ici

    Faut il que je continue à utiliser un ifstream, ou bien un wifstream, ou passer par des wstring, wchar_t, ou essayer de changer la locale des stream, je n'en ai aucune idée ...

    J'ai bien vu dans la FAQ une partie sur l'unicode, mais en fait le code ne semble pas compiler sous Visual C++ 2005, donc je n'ai pas pu tester.

    Voilà, n'importe quel conseil, suggestion, aide, sera grandement apprécié !

    Merci d'avance !

  2. #2
    Rédacteur/Modérateur
    Avatar de JolyLoic
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Août 2004
    Messages
    5 463
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Août 2004
    Messages : 5 463
    Points : 16 213
    Points
    16 213
    Par défaut
    Par défaut, windows travaille en UTF16 (avec une conversion depuis un encoding MBCS dépendant de la configuration de la machine), et non pas en UTF8, c'est donc normal que ta solution ne marche pas.

    Sous windows, du moins avec visual C++, les ifstreams possèdent un constructeur supplémentaire qui prend en paramètre un wstring. Tu devrais donc pouvoir faire :
    std::ifstream ifs(filepath.toStdWString())
    Ma session aux Microsoft TechDays 2013 : Développer en natif avec C++11.
    Celle des Microsoft TechDays 2014 : Bonnes pratiques pour apprivoiser le C++11 avec Visual C++
    Et celle des Microsoft TechDays 2015 : Visual C++ 2015 : voyage à la découverte d'un nouveau monde
    Je donne des formations au C++ en entreprise, n'hésitez pas à me contacter.

  3. #3
    Membre à l'essai
    Profil pro
    Inscrit en
    Avril 2005
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations forums :
    Inscription : Avril 2005
    Messages : 15
    Points : 16
    Points
    16
    Par défaut
    Citation Envoyé par JolyLoic Voir le message
    Par défaut, windows travaille en UTF16 (avec une conversion depuis un encoding MBCS dépendant de la configuration de la machine), et non pas en UTF8, c'est donc normal que ta solution ne marche pas.

    Sous windows, du moins avec visual C++, les ifstreams possèdent un constructeur supplémentaire qui prend en paramètre un wstring. Tu devrais donc pouvoir faire :
    std::ifstream ifs(filepath.toStdWString())

    Merci pour ta réponse, j'ai essayé ta solution, bizarrement ça n'a pas mieux fonctionné. En fait sous Windows le constructeur supplémentaire ne prend pas un std::wstring mais un const wchar_t* chez moi (VS2005), enfin c'est un détail, j'ai converti en wchar_t mais ça n'a rien donné.

    Par contre en listant un peu partout que Windows utilisait l'UTF-16 en interne, je me suis dit que c'était une piste à explorer. Et là j'ai remarqué que ifstream a également un constructeur avec un const unsigned short* , pour l'UTF-16 donc apparemment. J'ai donc utilisé filepath.utf16(), et là miracle, je peux lire mes fichiers

    Bref, même si les détails m'échappent, l'important c'est que ça marche, problème résolu merci encore !

  4. #4
    Rédacteur/Modérateur
    Avatar de JolyLoic
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Août 2004
    Messages
    5 463
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Août 2004
    Messages : 5 463
    Points : 16 213
    Points
    16 213
    Par défaut
    J'ai effectivement oublié dans ma réponse :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    std::ifstream ifs(filepath.toStdWString().c_str());
    Je ne sais pas trop ce que fait .utf16, mais ça ne dois pas être mal non plus.
    Ma session aux Microsoft TechDays 2013 : Développer en natif avec C++11.
    Celle des Microsoft TechDays 2014 : Bonnes pratiques pour apprivoiser le C++11 avec Visual C++
    Et celle des Microsoft TechDays 2015 : Visual C++ 2015 : voyage à la découverte d'un nouveau monde
    Je donne des formations au C++ en entreprise, n'hésitez pas à me contacter.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 0
    Dernier message: 18/11/2013, 18h43
  2. Trouver des noms de fichiers avec des caractères non ASCII
    Par llaffont dans le forum Shell et commandes GNU
    Réponses: 3
    Dernier message: 16/10/2012, 14h06
  3. Réponses: 3
    Dernier message: 24/04/2009, 09h12
  4. Détecter des caractères non-ASCII
    Par gvdmoort dans le forum Ruby
    Réponses: 2
    Dernier message: 27/01/2008, 13h16
  5. Probléme avec requétes contenant des caractéres spéciaux
    Par dragonfly dans le forum Requêtes
    Réponses: 1
    Dernier message: 08/11/2007, 17h20

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo