awk et recode : UTF8 -> ISO8859-1 possible ?
Salut,
au sein d'un script shell, il y a une partie awk qui traite toutes les lignes d'un fichier texte ISO8859-1: il les mémorise et les reporte à un endroit précis d'un autre fichier texte qui contient déjà des caractères spéciaux (notament le à)
le pb qui se pose est le suivant : si ces lignes contiennent des caractères spéciaux (é, è, ñ, etc), elles ne sont pas mémorisées, et donc ignorées par awk.
En creusant un peu j'ai découvert la commande recode avec laquelle je fais passer juyste avant le fichier qui sera traité par awk en UTF8, ce qui donne :
Code:
1 2
| 1.recode ISO8859-1..UTF8 préawk.txt
2.traitement par awk du fichier préawk.txt vers le fichier postawk.txt |
Naturellement j'aimerais beaucoup ajouter une étape 3 dont il n'est pas utile d'en dire plus que ce qui suit :
Code:
3.recode UTF8..ISO8859-1 postawk.txt
Malheureusement ça ne marche pas...
Code:
1 2
| recode UTF-8..ISO8859-1 postawk.txt
recode: postawk.txt failed: Entrée invalide in step `UTF-8..ISO-8859-1' |
Ca m'arrangerait vachement de trouver une astuce qui permette de repasser le fichier en iso8859 (encodage par défaut de mon éditeur de txt), existe-t-elle selon vous ? ou alors quelque chose d'autre peut être...
Merci