Bonjour,

Je travaille actuellement au Japon et je me suis heurté à un problème de conversion dernièrement typique au langage japonais (avis au amateurs). J'ai deux tracasseries à ce sujet.

Nous avons des fichiers qui sortent en SJIS mais sur un serveur Linux.

Sur ces fichiers nous voulons appliquer différents SED. Il s'agit de conversions de katakana en double byte vers des katakana en single byte (全角→半角)
Or, il semble que le sed ne puisse pas travailler avec le SJIS (encodé windows), uniquement en EUC (format unix).
C'est donc un premier point que je voudrais confirmer auprès de vous : est-ce qu'il y a un moyen d'exécuter mon SED sur des fichiers en SJIS ?

Le deuxième point qui me chagrine, c'est l'intégrité de mon fichier lors de cette conversion.
Puisqu'au final, je le veux quand même en SJIS, je suis obligé de le convertir de SJIS → EUC, d'appliquer mon SED, puis de reconvertir EUC → SJIS.

Est-ce que je peux être sur que la conversion va me rétablir mon fichier (outre les modifications effectuées via SED) et que je ne vais pas perdre des informations au passage ? Je pense notament à un caractere qui se transcrirait mal en EUC, et qui au retour de conversion ne serait pas rétabli dans son format d'origine. Est-ce que ça peut arriver ?


Voilà, avis au spécialiste du langage japonais ^^

Merci d'avance.