IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C Discussion :

teste chaine utf-8


Sujet :

C

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Profil pro
    Étudiant
    Inscrit en
    Avril 2007
    Messages
    411
    Détails du profil
    Informations personnelles :
    Âge : 37
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2007
    Messages : 411
    Par défaut teste chaine utf-8
    Bonjour,

    je dois réaliser un programme qui lit dans un fichier. et pour chaque caractère vérifie si c'est un caractère UTF-8. je dois donc lire bit par bit. le soucis étant que les caractères UTF-8 sont codé sur 2 octets. n'existe t-il pas une fonction en c qui vérifie dans une chaine de caractère si certain caractère sont codé en UTF-8?

  2. #2
    Inactif  
    Avatar de Mac LAK
    Profil pro
    Inscrit en
    Octobre 2004
    Messages
    3 893
    Détails du profil
    Informations personnelles :
    Âge : 51
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Octobre 2004
    Messages : 3 893
    Par défaut
    Pas en C standard, en tout cas. Il te faut soit utiliser des librairies portables sachant le faire, soit des fonctions non-portables du système d'exploitation, soit le refaire à la main. Regarde cette discussion, qui pourra peut-être t'aider un peu à ce sujet.
    Mac LAK.
    ___________________________________________________
    Ne prenez pas la vie trop au sérieux, de toutes façons, vous n'en sortirez pas vivant.

    Sources et composants Delphi sur mon site, L'antre du Lak.
    Pas de question technique par MP : posez-la dans un nouveau sujet, sur le forum adéquat.

    Rejoignez-nous sur : Serveur de fichiers [NAS] Le Tableau de bord projets Le groupe de travail ICMO

  3. #3
    Expert confirmé

    Inscrit en
    Août 2006
    Messages
    3 967
    Détails du profil
    Informations forums :
    Inscription : Août 2006
    Messages : 3 967
    Par défaut
    Goa,
    Citation Envoyé par totofe Voir le message
    Bonjour,

    je dois réaliser un programme qui lit dans un fichier. et pour chaque caractère vérifie si c'est un caractère UTF-8. je dois donc lire bit par bit. le soucis étant que les caractères UTF-8 sont codé sur 2 octets. n'existe t-il pas une fonction en c qui vérifie dans une chaine de caractère si certain caractère sont codé en UTF-8?
    C'est un peu plus compliqué que ça.

  4. #4
    Expert éminent
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 397
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 397
    Par défaut
    En effet. C'est surtout les caractères UCS-2 qui sont toujours codés sur 2 octets... Quant aux caractères UTF-16, ceux du Basic Multilingual Plane sont sur deux octets, les autres sur quatre...
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parlé avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

  5. #5
    Expert confirmé

    Inscrit en
    Août 2006
    Messages
    3 967
    Détails du profil
    Informations forums :
    Inscription : Août 2006
    Messages : 3 967
    Par défaut
    Goa,

    En UTF8, les caractères Unicode peuvent occuper de 1 à 4 octets.

  6. #6
    Inactif  
    Avatar de Mac LAK
    Profil pro
    Inscrit en
    Octobre 2004
    Messages
    3 893
    Détails du profil
    Informations personnelles :
    Âge : 51
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Octobre 2004
    Messages : 3 893
    Par défaut
    Citation Envoyé par droggo Voir le message
    En UTF8, les caractères Unicode peuvent occuper de 1 à 4 octets.
    Pour être plus précis, comme je le dit dans la discussion précédemment linkée, le codage UTF-8 permet même d'aller jusqu'à HUIT octets par caractère (même si, actuellement, la limite est bien quatre).
    De plus, un caractère peut être composite, donc composé de plusieurs caractères UTF-8 "unitaires"...
    Mac LAK.
    ___________________________________________________
    Ne prenez pas la vie trop au sérieux, de toutes façons, vous n'en sortirez pas vivant.

    Sources et composants Delphi sur mon site, L'antre du Lak.
    Pas de question technique par MP : posez-la dans un nouveau sujet, sur le forum adéquat.

    Rejoignez-nous sur : Serveur de fichiers [NAS] Le Tableau de bord projets Le groupe de travail ICMO

Discussions similaires

  1. Test chaine de caractere
    Par blackmanyo dans le forum Langage SQL
    Réponses: 3
    Dernier message: 30/10/2008, 10h35
  2. Test chaine de caractère
    Par judavid dans le forum Windows Forms
    Réponses: 3
    Dernier message: 30/05/2008, 22h02
  3. chaine UTF-8 en unicode
    Par Papy214 dans le forum Windows Forms
    Réponses: 6
    Dernier message: 22/03/2008, 09h38
  4. [.NET 2.0] Convertir une chaine utf-8 en Ascii
    Par abelman dans le forum Framework .NET
    Réponses: 2
    Dernier message: 30/04/2007, 20h47
  5. Encodage de chaine -> UTF-8
    Par klarky88 dans le forum MFC
    Réponses: 2
    Dernier message: 26/05/2005, 18h13

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo