IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C Discussion :

Lettre minuscule en EBCDIC


Sujet :

C

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Inscrit en
    Septembre 2005
    Messages
    747
    Détails du profil
    Informations forums :
    Inscription : Septembre 2005
    Messages : 747
    Par défaut Lettre minuscule en EBCDIC
    Bonjour,

    j'aurais besoin d'aide pour l'exo suivant
    Sur une machine avec codage EBCDIC natif pour les chaines de caractères, la fonction suivante est correcte ? Est-elle écrite en C- ANSI ? ESt-elle portable ?
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    int islower(int c) { return (c & 0x80) && (~c & 0x40); }
    Si quelqu'un pouvait m'aider

    Merci

  2. #2
    Expert confirmé

    Inscrit en
    Novembre 2005
    Messages
    5 145
    Détails du profil
    Informations forums :
    Inscription : Novembre 2005
    Messages : 5 145
    Par défaut
    Citation Envoyé par Premium
    j'aurais besoin d'aide pour l'exo suivant
    Et quelle est ta question?

    (Une remarque, je me demande si celui qui a pondu la question se rend compte qu'EBCDIC est une famille de jeux de caractères).

  3. #3
    Membre éclairé
    Inscrit en
    Septembre 2005
    Messages
    747
    Détails du profil
    Informations forums :
    Inscription : Septembre 2005
    Messages : 747
    Par défaut
    Citation Envoyé par Jean-Marc.Bourguet
    Et quelle est ta question?
    Celles de l'énoncé car je ne sais pas comment reconnaitre qu'une fonction est portable et si c'est en C-ansi.

  4. #4
    Membre Expert
    Avatar de Pragmateek
    Homme Profil pro
    Formateur expert .Net/C#
    Inscrit en
    Mars 2006
    Messages
    2 635
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Formateur expert .Net/C#
    Secteur : Conseil

    Informations forums :
    Inscription : Mars 2006
    Messages : 2 635
    Par défaut
    la fonction suivante est correcte ?
    Pour que la fonction renvoie vrai il faut que "c & 0x80" et "~c & 0x40" soit différent de zero.
    Pour que "c & 0x80" != 0 il faut "c>=0x80" car en binaire:
    0x80 = 10000000b et donc il faut que "c" ait au moins le 1er bit à 1, donc "c>=0x80".

    Pour que "~c & 0x40" != 0 il faut que le 2e bit de "~c" vale 1 car en binaire:
    0x40 = 01000000b et donc que le 2e bit de "c" vale 0.

    Donc ceci filtre tout les nombres ayant le 1er bit à un et le deuxième à 0:
    "10000000b <= c <= 10111111b"
    "0x80 <= c <= 0xBF"

    Ce qui garde les caractères minuscules car ils commencent à 0x81 tout en ne prenant pas les majuscules non accentuées qui commencent à 0xC1:
    http://fr.wikipedia.org/wiki/EBCDIC
    Donc tout dépend de si il faut considérer les majuscules accentuées comme des majuscules.
    Est-elle écrite en C- ANSI ?
    Les opérateurs et la syntaxe sont C- ANSI.
    Est-elle portable ?
    Pas sur un système utilisant le codage ASCII pour coder les caractères par exemple.

    Mieux vaut attendre confirmation d'Emdel.

  5. #5
    Expert éminent
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 395
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 395
    Par défaut
    Je ne qualifierais pas non-plus la fonction de portable, mais cela pourrait être une implémentation d'une fonction standard.

    C'est comme pour les graphiques : Chaque implémentation d'une "bibliothèque portable" est non-portable, mais pourtant les codes qui utilisent cette bibliothèque sont portables, puisque la bibliothèque a la bonne implémentation sur chaque machine.
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parlé avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

  6. #6
    Membre chevronné
    Avatar de Foobar1329
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    283
    Détails du profil
    Informations personnelles :
    Âge : 44
    Localisation : France, Finistère (Bretagne)

    Informations forums :
    Inscription : Juin 2006
    Messages : 283
    Par défaut
    Citation Envoyé par seriousme
    Pour que la fonction renvoie vrai il faut que "c & 0x80" et "~c & 0x40" soit différent de zero.
    Pour que "c & 0x80" != 0 il faut "c>=0x80" car en binaire:
    0x80 = 10000000b et donc il faut que "c" ait au moins le 1er bit à 1, donc "c>=0x80".

    Pour que "~c & 0x40" != 0 il faut que le 2e bit de "~c" vale 1 car en binaire:
    0x40 = 01000000b et donc que le 2e bit de "c" vale 0.

    Donc ceci filtre tout les nombres ayant le 1er bit à un et le deuxième à 0:
    "10000000b <= c <= 10111111b"
    "0x80 <= c <= 0xBF"

    Ce qui garde les caractères minuscules car ils commencent à 0x81 tout en ne prenant pas les majuscules non accentuées qui commencent à 0xC1:
    http://fr.wikipedia.org/wiki/EBCDIC
    Donc tout dépend de si il faut considérer les majuscules accentuées comme des majuscules.
    Non. A la différence d'un encodage comme ASCII, EBCDIC n'a pas les lettres de l'alphabet latin dans une casse donnée contigües. 0x8B n'est pas une lettre minuscule, et pourtant cette fonction va renvoyer vrai.

    Pour être portable entre encodages ASCII et EBCDIC, il faudrait :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    int islower(int ch)
    {
       return ( (ch >= 'a' && ch <= 'i') ||  (ch >= 'j' && ch <= 'r') || (ch >= 's' && ch <= 'z') );
    }
    A+

  7. #7
    Membre Expert
    Avatar de Pragmateek
    Homme Profil pro
    Formateur expert .Net/C#
    Inscrit en
    Mars 2006
    Messages
    2 635
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Formateur expert .Net/C#
    Secteur : Conseil

    Informations forums :
    Inscription : Mars 2006
    Messages : 2 635
    Par défaut
    Non. A la différence d'un encodage comme ASCII, EBCDIC n'a pas les lettres de l'alphabet latin dans une casse donnée contigües. 0x8B n'est pas une lettre minuscule, et pourtant cette fonction va renvoyer vrai.
    D'où le:
    tout en ne prenant pas les majuscules non accentuées
    tout dépend de si il faut considérer les majuscules accentuées comme des majuscules.

  8. #8
    Membre chevronné
    Avatar de Foobar1329
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    283
    Détails du profil
    Informations personnelles :
    Âge : 44
    Localisation : France, Finistère (Bretagne)

    Informations forums :
    Inscription : Juin 2006
    Messages : 283
    Par défaut
    Hello,

    Citation Envoyé par Premium
    Celles de l'énoncé car je ne sais pas comment reconnaitre qu'une fonction est portable et si c'est en C-ansi.
    Ben quand même !

    Est-ce que les éléments lexicaux présents font entorse à la syntaxe et à la grammaire du langage C, ben non, donc c'est bien du C. Après dire qu'il s'agit de 'C-ANSI', tu peux enquiquiner la personne qui a posé la question :
    exple de réponse à la con : peut être que oui, peut être que non, cela peut aussi être de l'ISO C99, de même que du C++ et même du Java valide ! Et quand j'y pense, je crois bien qu'il y a déjà une fonction de ce nom là dans la bibliothèque standard (classification des caractères <ctype.h>).

    Le gentil élève répond oui de toutes façons, et ça ne sert à rien de faire le guignol mais il y a des fois où on en a bien envie.

    Parce que parler de C ANSI (aussi appelé C 89), c'est non seulement parler d'un language (le C), mais aussi d'une norme américaine qui inclut en plus du langage une bibliothèque avec un ensemble de fonctions. Cette norme a été adoptée un an après comme standard international en 1990 par l'ISO (C90).
    C ANSI = C 89 = C90.

    Donc parler de langage C valide était suffisant dans l'énoncé.

    Ensuite, EBCDIC, il s'agit d'un encodage de caractères sur 8 bits supportant plusieurs jeux de caractères différents (CP 297 pour la France).

    Suffit de trouver une table sur le net, et avec EBCDIC, pour les caractères de l'alphabet latin en minuscules, c'est l'ensemble
    [0x81 à 0x89] [a..i]
    +
    [0x91 à 0x99] [j..r]
    +
    [0xA2 à 0xA9] [s..z]

    Un petit programme permet donc de tester cette fonction islower() :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    #include <stdio.h>
     
    #define IS_EBCDIC_LC_LETTER(c)\
        ( ( (c) >= 0x81 && (c) <= 0x89 ) ||\
        ( (c) >= 0x91 && (c) <= 0x99 ) ||\
        ( (c) >= 0xA2 && (c) <= 0xA9 ) )
     
     
    int islower_(int c) 
    { 
       return (c & 0x80) && (~c & 0x40); 
    }
     
    int main(void)
    {
       int ch = 0;
     
       for(ch=0; ch<256; ++ch)
       {
         if (IS_EBCDIC_LC_LETTER(ch) && !islower_(ch)) 
    	 {
    		fprintf(stderr, "islower_() merde pour %#02x\n", ch);
    		fprintf(stderr, "   islower_() dit que %#02x n'est pas EBCDIC, et ben si pourtant.\n", ch);
    	 }
     
    	 if (!IS_EBCDIC_LC_LETTER(ch) && islower_(ch)) 
    	 {
            fprintf(stderr, "islower_() merde pour %#02x\n", ch);
    		fprintf(stderr, "   islower_() dit que %#02x est une lettre minuscule en EBCDIC, c'est faux\n", ch);
         }	
       }
     
        return 0;
    }
    Conclusion empirique, non, ce n'est une fonction correcte avec un encodage EBCDIC. Et ce n'est pas portable.


    A+

Discussions similaires

  1. [AC-2003] Comment mettre la 1er lettre en majuscule et le reste en minuscule
    Par spacesheep dans le forum IHM
    Réponses: 26
    Dernier message: 10/11/2009, 08h23
  2. Comment forcer un champ en minuscule, et première lettre en majuscule
    Par moilou2 dans le forum Macros et VBA Excel
    Réponses: 25
    Dernier message: 08/09/2008, 16h57
  3. Transformer une lettre minuscule en majuscule
    Par Invité dans le forum Pascal
    Réponses: 16
    Dernier message: 13/01/2008, 09h11
  4. [VBA - E]Prendre en compte les lettres majuscules et minuscules
    Par alex_elder1_1 dans le forum Macros et VBA Excel
    Réponses: 7
    Dernier message: 15/12/2006, 15h52
  5. 1ere lettre en majuscule et le reste en minuscule
    Par pascale86 dans le forum Langage
    Réponses: 3
    Dernier message: 23/10/2006, 15h53

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo