Bonjour !
Voilà, j'aurais aimé savoir, comment peut-on faire pour coder un caractère ASCII en version Unicode ou du moins, comment calculer le code d'un caractère de l'ASCII à l'Unicode ?
Merci bien pour vos lumières![]()
Bonjour !
Voilà, j'aurais aimé savoir, comment peut-on faire pour coder un caractère ASCII en version Unicode ou du moins, comment calculer le code d'un caractère de l'ASCII à l'Unicode ?
Merci bien pour vos lumières![]()
Mon Site
Ma bibliothèque de gestion des chaînes de caractères en C
L'imagination est plus importante que le savoir. A. Einstein
Je ne répond à aucune question technique par MP, merci d'avance !
Salut,
Bein c'est tout simple, l'ascii est la base de pas mal d'encodages, dont la table unicode. Donc pas de transformation.
![]()
Ha ! Bon bin j'aurais appris quelque chose ce soirEnvoyé par Gruik
Merci
![]()
Mon Site
Ma bibliothèque de gestion des chaînes de caractères en C
L'imagination est plus importante que le savoir. A. Einstein
Je ne répond à aucune question technique par MP, merci d'avance !
On parle bien d'ASCII, c'est à dire des codes de 0 à 127. Ce ne comprend évidemment pas les accentuées et autres gâteries...Envoyé par Franck.H
Bin le code correspondant à un caractère stocké dans un type char tout simplement !Envoyé par Emmanuel Delahaye
Mon Site
Ma bibliothèque de gestion des chaînes de caractères en C
L'imagination est plus importante que le savoir. A. Einstein
Je ne répond à aucune question technique par MP, merci d'avance !
Oui, j'étais un peu pressé...
Les gens assimilent le "texte de base" à l'ascii sans savoir ce qu'est reellement l'ascii. En fait quand ils parlent d'ascii, il s'agit souvent de l'encodage 8bits du système où ils se trouvent.
Si on s'est jamais posé la question, il peut être difficile de savoir "dans quel encodage est mon texte".
Les encodages 8bits basés sur l'ascii (c'est à dire, dont la tranche 0x00-0x7f est l'ascii) les plus connus sont : windows-1252 (aussi appelé ANSI, ou cp1252), iso-8859-1 (aussi appelé latin1), et utf-8.
Si ton texte est en latin1, alors il n'y a rien à faire non plus comme transformation puisque c'est aussi la base de la table unicode (pour les caractères 0x00-0xff, tandis que l'ascii c'était juste 0x00-0x7f).
Pour windows-1252, c'est pareil que latin1, sauf que ya la tranche 0x80-0x9f qui est utilisée pour mettre des caractères supplementaires (comme le symbole euro et l'e dans l'o), tranche inutilisée dans la table unicode/latin1. Ces caractères ont une équivalence en caractère unicode, mais pas directe.
Utiliser iconv dans ce cas là... (mais je pense pas qu'iconv permette de retrouver directement le code unicode d'un caractère, il permet juste de faire des conversions d'encodages à encodages)
Ok merci pour ces précisions![]()
Mon Site
Ma bibliothèque de gestion des chaînes de caractères en C
L'imagination est plus importante que le savoir. A. Einstein
Je ne répond à aucune question technique par MP, merci d'avance !
Partager