IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

iconv + //TRANSLIT - conserver le nombre de caractères


Sujet :

Shell et commandes GNU

  1. #1
    Membre averti
    Inscrit en
    Juillet 2008
    Messages
    51
    Détails du profil
    Informations forums :
    Inscription : Juillet 2008
    Messages : 51
    Par défaut iconv + //TRANSLIT - conserver le nombre de caractères
    Bonjour,

    Je dois effectuer une conversion d'encodage de utf8 vers iso8859, en remplaçant les caractères "inconnus" sous iso par leur équivalent. J'utilise donc la commande iconv avec le suffixe //TRANSLIT.

    Parfois le caractère inconnu est remplacé par plusieurs caractères (exemple : œ devient oe) et dans mon cas ce n'est pas acceptable (contrôle strict sur la longueur du contenu des champs).

    Utiliser le suffixe //IGNORE à la place de //TRANSLIT n'est pas envisageable car il modifie aussi le nombre de caractères.


    Je cherche donc un moyen de faire la translitération en conservant le nombre de caractères d'origine, quitte à "fausser" un peu le contenu de la donnée (ex : si œ devient e ça passe).

    Existe-t-il une option pour TRANSLIT permettant de conserver le nombre de caractères ? Ou une autre fonction "standard" pour faire la même chose ? (je préfère éviter autant que possible les bricolages avec sed ou ce genre de chose)


    Je vous remercie par avance pour votre aide.

  2. #2
    Expert confirmé Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 982
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 982
    Par défaut
    Je dois effectuer une conversion d'encodage de utf8 vers iso8859
    Quel ISO 8859 ? Il y en a 16. Tu parles du œ qui se transforme en deux caractères o et e, mais ce ne serait pas le cas avec ISO 8859-15 où figure le e dans l'o. Si tu as le choix entre ISO 8859-1 et ISO 8859-15, tente avec ce dernier pour voir ce que ça donne.

    Citation Envoyé par Laaris Voir le message
    Existe-t-il une option pour TRANSLIT permettant de conserver le nombre de caractères ?
    Non.

    Ou une autre fonction "standard" pour faire la même chose ? (je préfère éviter autant que possible les bricolages avec sed ou ce genre de chose)
    Je ne crois pas qu'il existe un outil "standard" qui fasse ce dont tu parles et disponible en shell. Pour ce qui est du "bricolage", vu ce que tu essaies de faire, je pense que tu as déjà les deux pieds dans le magasin. Sed ou Awk sont de puissants outils, des languages à part entière, et c'est uniquement l'usage qu'on en fait qui va déterminer s'il s'agit de "bricolage" ou pas. Si les caractères qui posent problème sont en nombre limité, utiliser sed au préalable est plutôt une bonne option.

    Tu peux aussi te tourner vers un langage de script quelconque qui dispose d'un wrapper vers le transliterator d'ICU (à ma connaissance, ça existe en Python, PHP et Ruby, mais pas en Perl). C'est l'arme absolue qui permet de définir des rêgles de transformation trés précises. Le hic c'est que celà demande de l'apprentissage, et que la documentation pique un peu les yeux. Mais tu pourras effectuer toutes les transformations préalables au changement d'encodage afin de conserver la taille apparente de la chaîne.

Discussions similaires

  1. [JTextArea] limiter le nombre de caractères
    Par spoutyoyo dans le forum Composants
    Réponses: 5
    Dernier message: 14/09/2007, 15h45
  2. Réponses: 7
    Dernier message: 16/11/2004, 15h45
  3. Réponses: 2
    Dernier message: 21/09/2004, 19h01
  4. [JTextField] Limiter le nombre de caractères
    Par thomas_strass dans le forum Composants
    Réponses: 2
    Dernier message: 08/09/2004, 14h06
  5. nombre de caractère retourné...
    Par sonialem2000 dans le forum Requêtes
    Réponses: 2
    Dernier message: 02/08/2004, 04h06

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo