IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Boost C++ Discussion :

BOOST :: REGEX et UNICODE


Sujet :

Boost C++

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Septembre 2005
    Messages
    35
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations forums :
    Inscription : Septembre 2005
    Messages : 35
    Par défaut BOOST :: REGEX et UNICODE
    Bonjour à tous,

    Alors la question du jour, je dis ça parce que je commence à être abonné sur ce forum (3 questions en moins d'une semaine..), non sans déconner, l'instant est grave.

    Ma question est la suivante :

    Comment fait-on pour faire un motif qui sera capable à la fois de trouvé des caractères accentués en cp1252, utf-8 ainsi que tous les autres charset ?

    Car en fait, si l'on met les caractères accentués directement dans la regex, ils ne trouverons que ceux encodés dans le même charset que celui utilisé pour faire le motif (j'ai testé ).

    Donc deuxième question :

    Es-ce que l'emploi de <boost/regex/icu.hpp> me permettra d'utilser des motifs tels que \X ou \p{L} afin de trouvé les caractères accentués dans des fichiers encodés avec des charsets différents.

    S'il vous plaît, si quelqu'un pourrait m'éclairer un peu sur la question parce que la je crack

  2. #2
    Expert confirmé

    Inscrit en
    Novembre 2005
    Messages
    5 145
    Détails du profil
    Informations forums :
    Inscription : Novembre 2005
    Messages : 5 145
    Par défaut
    La technique normale est de tout transformer en un charset fixe en interne (disons Unicode), de ne manipuler que cela jusqu'a la sortie ou on utilise le charset qu'il faut.

    Une alternative est de transcoder ta regexp dans le charset qui va bien avant de l'utiliser.

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Septembre 2005
    Messages
    35
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations forums :
    Inscription : Septembre 2005
    Messages : 35
    Par défaut
    C'est vraiment lourd, ces histoires de charset..

    Alors, ça a l'air vraiment fastidieux et en plus je n'ai pas beaucoup de temps
    C'est hallucinant, tout ce passait bien dans mon développement, jusqu'à ce que je doive esquiver tout les commentaires /* blabla */ des fichiers C que je parse.
    Je m'étais dit c'est cool je vais avancer dans le fichier tant que c'est du commentaire et faire le traitement sur le code qui suit et ainsi de suite mais c'était sans compter sur les mecs qui mettent des é,è,à,ê,ect.. dans leur commentaire.. Parce que, lorsque l'on fait une regex du style :
    les accents ne sont pas prits en compte..

    Donc, en fait ce que tu me conseil de faire c'est de détecter quel charset est utilisé par le fichier à parser, de convertir ma regex qui contiendra les accents en ce même charset, pour enfin, pouvoir effectuer une comparaison.

    Ok je vais essayer de voir comment on fait ça.

  4. #4
    Rédacteur/Modérateur
    Avatar de JolyLoic
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Août 2004
    Messages
    5 463
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Août 2004
    Messages : 5 463
    Par défaut
    J'ai déplacé la discussion sur l'utilisation des accents dans un code source vers :
    http://www.developpez.net/forums/d68...e/#post3976813
    Ma session aux Microsoft TechDays 2013 : Développer en natif avec C++11.
    Celle des Microsoft TechDays 2014 : Bonnes pratiques pour apprivoiser le C++11 avec Visual C++
    Et celle des Microsoft TechDays 2015 : Visual C++ 2015 : voyage à la découverte d'un nouveau monde
    Je donne des formations au C++ en entreprise, n'hésitez pas à me contacter.

Discussions similaires

  1. BOOST :: REGEX PATTERN IMPOSSIBLE ?
    Par Jah77 dans le forum Boost
    Réponses: 2
    Dernier message: 26/01/2009, 14h50
  2. BOOST :: REGEX INSERTION
    Par Jah77 dans le forum Boost
    Réponses: 2
    Dernier message: 20/01/2009, 10h25
  3. [boost] Regex search : trouver l'index
    Par Choupi dans le forum Boost
    Réponses: 4
    Dernier message: 03/12/2007, 11h17
  4. Configurer boost / regex.
    Par OrthoMaker dans le forum Boost
    Réponses: 11
    Dernier message: 06/08/2007, 09h34

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo