IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C Discussion :

Problème caractère spécial


Sujet :

C

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    132
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 132
    Points : 89
    Points
    89
    Par défaut Problème caractère spécial
    Bonjour, je suis en train de faire un plugin pour Pidgin pour parser les caractères de couleurs de Messenger plus. Pour les balises "[c=XX]" je n'ai pas de soucis, mais quand j'arrive aux couleurs avec le caractère '·', tout se complique...

    J'ai essayé un simple if (*p == '·'), aussi essayé '0x00B7', et dans les deux cas, j'obtiens :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    plus.c:134:18: warning: character constant too long for its type
    plus.c:134: warning: comparison is always false due to limited range of data type
    Quelqu'un pourrait m'éclairer sur les caractères spéciaux en C ?

  2. #2
    Expert éminent sénior
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 382
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 382
    Points : 41 593
    Points
    41 593
    Par défaut
    unsigned char ou (char)'·'

  3. #3
    Membre régulier
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    132
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 132
    Points : 89
    Points
    89
    Par défaut
    J'ai "plus.c:134:24: warning: character constant too long for its type", que ce soit en char ou unsigned char

  4. #4
    Expert éminent sénior
    Avatar de Emmanuel Delahaye
    Profil pro
    Retraité
    Inscrit en
    Décembre 2003
    Messages
    14 512
    Détails du profil
    Informations personnelles :
    Âge : 68
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Retraité

    Informations forums :
    Inscription : Décembre 2003
    Messages : 14 512
    Points : 20 985
    Points
    20 985
    Par défaut
    Citation Envoyé par Marc31boss Voir le message
    Bonjour, je suis en train de faire un plugin pour Pidgin pour parser les caractères de couleurs de Messenger plus. Pour les balises "[c=XX]" je n'ai pas de soucis, mais quand j'arrive aux couleurs avec le caractère '·', tout se complique...

    J'ai essayé un simple if (*p == '·'), aussi essayé '0x00B7', et dans les deux cas, j'obtiens :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    plus.c:134:18: warning: character constant too long for its type
    plus.c:134: warning: comparison is always false due to limited range of data type
    La syntaxe est incorrecte. C'est '\xB7'

    ou, en octal :

    B7 = 1011 0111 soit 010 110 111 soit en octal : 267.

    On ecrit donc '\267'
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
     
    #include <stdio.h>
     
    int main (void)
    {
       putchar ('\xB7');
       putchar ('\267');
       putchar ('\n');
     
       return 0;
    }
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    ÀÀ
     
    Process returned 0 (0x0)   execution time : 0.036 s
    Press any key to continue.
    Le glyphe produit dépend de l'ensemble de caractères utilisés...

    Cette table http://emmanuel-delahaye.developpez....d/inc/ansi.itm indique que le caractère valant B7 produit un glyphe 'middle dot' (entité html : &middot; ) en ANSI et un A grave en OEM.

  5. #5
    Membre confirmé Avatar de dapounet
    Profil pro
    Étudiant
    Inscrit en
    Juillet 2007
    Messages
    469
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juillet 2007
    Messages : 469
    Points : 567
    Points
    567
    Par défaut
    Bonjour,

    Le résultat dépend de ta plateforme. Sous FreeBSD ce code
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    #include<stdio.h>
     
    int main (void)
    {
      char s[] = "·";
     
      printf("%u\n", (unsigned int)sizeof s);
     
      return 0;
    }
    affiche 3, donc le caractère doit être codé sur plusieurs bytes. Je crois que c'est pareil sous Linux.

  6. #6
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 492
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 492
    Points : 37 111
    Points
    37 111
    Par défaut
    Citation Envoyé par dapounet Voir le message
    Bonjour,

    Le résultat dépend de ta plateforme. Sous FreeBSD ce code
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    #include<stdio.h>
     
    int main (void)
    {
      char s[] = "·";
     
      printf("%u\n", (unsigned int)sizeof s);
     
      return 0;
    }
    affiche 3, donc le caractère doit être codé sur plusieurs bytes. Je crois que c'est pareil sous Linux.
    Je ne comprends pas la valeur(=3) retournée mais "." est un tableau de caractères et la taille de s incluant le 0 derrière ne peut être que > 1.

    En tout cas, je ne vois pas trop le rapport avec le *p == '.' initial.
    Mais peut être que l'auteur du post pourrait nous fournir un exemple succinct reproduisant son problème.
    -W

  7. #7
    Membre régulier
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    132
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 132
    Points : 89
    Points
    89
    Par défaut
    Citation Envoyé par Emmanuel Delahaye Voir le message
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
     
    #include <stdio.h>
     
    int main (void)
    {
       putchar ('\xB7');
       putchar ('\267');
       putchar ('\n');
     
       return 0;
    }
    J'obtiens bien le caractère, mais ma condition n'est toujours pas vérifiée. Il y a un moyen de connaître l'encodage utilisé par une chaîne ?

    Wiztricks, j'ai une boucle qui traite tous les caractères du pseudo à afficher (caractère actuel : *p). J'ai une condition quelques lignes au dessus, if (*p == '[') qui elle est bien vérifiée quand le caractère actuel est [. Mais impossible de vérifier celle du caractère '·'.

  8. #8
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 492
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 492
    Points : 37 111
    Points
    37 111
    Par défaut
    Wiztricks, j'ai une boucle qui traite tous les caractères du pseudo à afficher (caractère actuel : *p). J'ai une condition quelques lignes au dessus, if (*p == '[') qui elle est bien vérifiée quand le caractère actuel est [. Mais impossible de vérifier celle du caractère '·'.
    Avec un coup de GDB ou de printf, il serait bon de vérifier (3 fois) que le contenu de *p est bien '.'
    Si c'est le cas et que tu ne postes pas un reproducteur, il faudra te résoudre à acheter de l'aspirine
    -W

  9. #9
    Membre régulier
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    132
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 132
    Points : 89
    Points
    89
    Par défaut
    Citation Envoyé par wiztricks Voir le message
    Si c'est le cas et que tu ne postes pas un reproducteur, il faudra te résoudre à acheter de l'aspirine
    -W
    C'est à dire un reproducteur ? Je viens de vérifier, il y a bien des · qui passent

  10. #10
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 492
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 492
    Points : 37 111
    Points
    37 111
    Par défaut
    Citation Envoyé par Marc31boss Voir le message
    C'est à dire un reproducteur ? Je viens de vérifier, il y a bien des · qui passent
    Quelque chose reproduisant le problème et avec lequel nous pourrions jouer.

  11. #11
    Membre régulier
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    132
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 132
    Points : 89
    Points
    89
    Par défaut
    Je viens de faire un petit prog de test et la sortie est... Étrange :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
     
    #include <stdio.h>
    int main (void) {
    	char *p = "qF·sd·[f";
    	for(;*p;p++) {
    		printf("%c : ", *p);
    		if (*p == '\xB7')
    			printf("Condition ok\n");
    		else
    			printf("Condition non ok\n");
    	}
    }
    Qui me renvoie :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
     
    q : Condition non ok
    F : Condition non ok
    � : Condition non ok
    � : Condition ok
    s : Condition non ok
    d : Condition non ok
    � : Condition non ok
    � : Condition ok
    [ : Condition non ok
    f : Condition non ok
    Donc les points seraient interprétés comme étant deux caractères. Je vais retourner approfondir un peu ça.

  12. #12
    Expert éminent sénior
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 382
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 382
    Points : 41 593
    Points
    41 593
    Par défaut
    Tu bosses sur un système unixoïde réglé en UTF-8 ?
    Ou bien, ton fichier source est-il en UTF-8 ?

  13. #13
    Membre régulier
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    132
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 132
    Points : 89
    Points
    89
    Par défaut
    Oui, sous Debian, et mes fichiers sources sont bien en UTF-8 aussi

  14. #14
    Expert éminent sénior
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 382
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 382
    Points : 41 593
    Points
    41 593
    Par défaut
    Ben voilà.
    Le caractère 0xB7 (183) s'exprime, en UTF-8, 0xC2 0xB7

  15. #15
    Membre régulier
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    132
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 132
    Points : 89
    Points
    89
    Par défaut
    Exact, merci beaucoup, je cherchais une solution compliquée à un problème simple, pour changer

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [PHP 5.3] problème caractère spécial '
    Par knebhi dans le forum Langage
    Réponses: 0
    Dernier message: 02/04/2010, 18h55
  2. Réponses: 4
    Dernier message: 31/03/2008, 18h33
  3. [XML] Problème de caractère spécial
    Par webrider dans le forum Bibliothèques et frameworks
    Réponses: 3
    Dernier message: 15/11/2007, 23h48
  4. Problème étrange caractère spécial
    Par comboDev dans le forum C#
    Réponses: 6
    Dernier message: 10/08/2007, 10h49
  5. [DOM][PHP] Problème d'insertion de caractère spécial
    Par Oscar Hiboux dans le forum Bibliothèques et frameworks
    Réponses: 1
    Dernier message: 09/01/2007, 17h25

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo