IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C Discussion :

Traitement de chaîne Unicode, reconnaissance du charset


Sujet :

C

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Mai 2007
    Messages
    12
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2007
    Messages : 12
    Par défaut Traitement de chaîne Unicode, reconnaissance du charset
    Bonjour, je dois traiter des pages dont je connais pas le charset, y a t-il qlq1 qui a une idée pour reconnaître le charset correspondant à une page.

    langage : C

    Merci

  2. #2
    Membre Expert
    Avatar de Gruik
    Profil pro
    Développeur Web
    Inscrit en
    Juillet 2003
    Messages
    1 566
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Juillet 2003
    Messages : 1 566
    Par défaut
    Salut,

    On peut pas reconnaitre un charset, on peut juste dire qu'un bout de texte n'est pas dans tel charset. L'information "dans quel charset est ce bout de texte" doit être ailleurs que dans le bout de texte, ou alors celui qui utilise ce bout de texte doit indiquer lui meme dans quel charset est le bout de texte.
    Dans les fichiers xml ça fait l'objet d'un entete.

  3. #3
    Rédacteur
    Avatar de Vincent Rogier
    Profil pro
    Inscrit en
    Juillet 2007
    Messages
    2 373
    Détails du profil
    Informations personnelles :
    Âge : 47
    Localisation : France

    Informations forums :
    Inscription : Juillet 2007
    Messages : 2 373
    Par défaut
    Effectivement, comme le dit Gruik, c'est pas vraiment possible.

    Par contre, ce qui est possible c'est d'essayer de deviner l"encodage.
    Grosso modo, ansi, UFT16 et 32 (ainsi que leur version L/B endian) et voire UTF8 (mais c'est plus galère et moins sûr) sont reconnaissables après étude des octets d'un bout de texte.

    C'est d'ailleurs ce que fait la fonction fonction windows IsTextUnicode(si ma mémoire est bonne).
    Vincent Rogier.

    Rubrique ORACLE : Accueil - Forum - Tutoriels - FAQ - Livres - Blog

    Vous voulez contribuer à la rubrique Oracle ? Contactez la rubrique !

    OCILIB (C Driver for Oracle)

    Librairie C Open Source multi-plateformes pour accéder et manipuler des bases de données Oracle

  4. #4
    Membre Expert
    Avatar de Gruik
    Profil pro
    Développeur Web
    Inscrit en
    Juillet 2003
    Messages
    1 566
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Juillet 2003
    Messages : 1 566
    Par défaut
    Le programme linux "file" essaye aussi de deviner l'encodage des fichiers texte

Discussions similaires

  1. traitement des chaînes ?
    Par mascoco dans le forum SQL
    Réponses: 3
    Dernier message: 23/10/2006, 13h37
  2. Problème avec traitement de chaînes
    Par cortex007 dans le forum Langage
    Réponses: 6
    Dernier message: 25/04/2006, 16h22
  3. Traitement sur chaîne
    Par Fabouney dans le forum C
    Réponses: 3
    Dernier message: 28/02/2006, 12h35
  4. [RegEx] Traitement de chaîne
    Par Oberown dans le forum Langage
    Réponses: 1
    Dernier message: 12/02/2006, 22h27
  5. [RegEx] Pb traitement de chaînes avec les regex
    Par Invité dans le forum Langage
    Réponses: 2
    Dernier message: 25/09/2005, 00h00

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo