IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Construire une escape sequence unicode par concaténation [Python 3.X]


Sujet :

Python

  1. #1
    Candidat au Club
    Homme Profil pro
    Enseignant
    Inscrit en
    Septembre 2019
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Septembre 2019
    Messages : 2
    Points : 3
    Points
    3
    Par défaut Construire une escape sequence unicode par concaténation
    Bonjour,
    Je suis enseignant en lycée et j'ai naïvement imaginé faire écrire à mes élève le petit script suivant:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    code_hexa=input()
    print("\u"+code_hexa)
    L’interpréteur refuse de le compiler. Je me demande simplement si ce genre d'approche est une impasse ou s'il y a une façon simple de faire celà que je n'ai pas trouvé.
    Merci d'avance

  2. #2
    Expert éminent Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 035
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 035
    Points : 8 400
    Points
    8 400
    Par défaut
    salut,

    ça dépend ce que tu veux faire, s'il s'agit d'afficher \u1f40d il faut doubler l'échappement :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    code_hexa=input()
    print("\\u"+code_hexa)
    si le but c'est d'afficher la représentation du caractère unicode le moyen le plus simple que je vois c'est un truc du genre :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    code_hexa=input()
    print('{:c}'.format(int(code_hexa, 16)))
    c'est moins trivial d'un coup, et encore faut-il que le terminal puisse afficher le caractère, ce qui concernant typiquement les emojis est rarement le cas


  3. #3
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 283
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 283
    Points : 36 770
    Points
    36 770
    Par défaut
    Salut,

    \x, \u, ... ne sont pas une suite de 2 caractères mais des commandes qui disent "attention, ce qui suit est un caractère codé en...".

    Et si on écrit "\x" + "41", on demande à Python de construire la chaîne de caractères "\x" (qu'il ne sait pas construire parce que le caractère \x est incomplet) puis de la concaténer avec...
    Exemples:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    >>> "\u0041"
    'A'
    >>> "\x41"
    'A'
    >>> '\x' + '41'
      File "<stdin>", line 1
    SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 0-1: truncated \xXX escape
    On peut dire à Python de ne pas interpréter "\x":
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    >>> r'\x' + '41'
    '\\x41'
    >>>
    mais dans ce cas, on a fabriqué une chaîne de 4 caractères et non le caractère correspondant à l'hexadécimal 41.

    Ceci dit, les fonctions ord et chr sont là pour récupérer le point unicode et la chaine de caractères associée à un nombre:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    >>> ord('A')
    65
    >>> chr(65)
    'A'
    >>>
    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  4. #4
    Expert éminent Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 035
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 035
    Points : 8 400
    Points
    8 400
    Par défaut
    Citation Envoyé par wiztricks Voir le message
    les fonctions ord et chr sont là pour récupérer le point unicode et la chaine de caractères associée à un nombre
    je sais pas pourquoi j'étais persuadé que chr() ne fonctionnait que sur ASCII c'est bien ça me fait une piqûre de rappel

  5. #5
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 283
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 283
    Points : 36 770
    Points
    36 770
    Par défaut
    Citation Envoyé par BufferBob Voir le message
    je sais pas pourquoi j'étais persuadé que chr() ne fonctionnait que sur ASCII c'est bien ça me fait une piqûre de rappel
    Sans doute parce que c’était le cas sous Python2. Il fallait utiliser la fonction unichr, chr étant limité à l'intervalle 0..255.
    Python3 a unifié tout çà: disparue la fonction unichr et chr devient valide pour tout entier dans 0..0x10ffff.

    Ceci dit, avec la correspondance entre byte dans 0..255 et "caractères" ASCII étendus, on avait une correspondance simple pour avoir une relation d'ordre sur les chaines de caractères: ord('A') < ord('a') <=> 'A' < 'a'.

    Maintenant les accents, les polices de caractères non alphabétiques,... compliquent tout çà de façon intéressante.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  6. #6
    Candidat au Club
    Homme Profil pro
    Enseignant
    Inscrit en
    Septembre 2019
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Septembre 2019
    Messages : 2
    Points : 3
    Points
    3
    Par défaut
    Merci pour toutes vos réponses. Cela confirme ce que j'avais déjà cherché.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. construire une V sequence
    Par sophielow dans le forum MATLAB
    Réponses: 3
    Dernier message: 31/10/2013, 09h11
  2. Réponses: 2
    Dernier message: 30/03/2008, 20h33
  3. [ASE 15] Envoyer le resultat d'une requète en unicode par mail
    Par antho57 dans le forum Adaptive Server Enterprise
    Réponses: 1
    Dernier message: 25/03/2008, 12h21
  4. Réponses: 2
    Dernier message: 18/10/2007, 09h13
  5. Réponses: 4
    Dernier message: 10/08/2007, 12h02

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo