Bonjour,
Je me lance sans prétention 
J'ouvre bien le fichier en UTF-8
C'est incontournable bien sûr mais, mais suivant ce que tu fais, ça ne suffit pas.
Il faut avoir en tête d'être UTF-8 sur TOUTE LA LIGNE.
UTF-8 sur TOUTE LA LIGNE ça veut dire :
- Ouverture et traitement des fichiers (pour ça tu sembles OK) :
open IN_Fic, '<:encoding(UTF-8)', $fichier_titre
- Si tu traites des libellés en chinois à l'intérieur du programme perl.pl il ne faut pas oublier use utf8; :
1 2 3 4
| #!/usr/bin/perl
use strict;
use warnings;
use utf8; |
- Dans les expressions régulières dans la mesure du possible utilise la notation UTF-8 :
1 2 3 4
| $Lig =~ s/\x{064E}\x{0627}/\x{0627}/go; # Supprime Fatha devant Alif ?
$Lig =~ s/\x{064E}\x{0649}/\x{0649}/go; # Supprime Fatha devant Alif marsour ?
$Lig =~ s/\x{0650}\x{064A}/\x{064A}/go; # Supprime Kasra devant Ya ?
$Lig =~ s/\x{064F}\x{0648}/\x{0648}/go; # Supprime Damma devant Oua ? |
Là, ce sont des caractères arabes.
- Enfin le code de tes programmes doivent être eux-même sauvegardés UTF-8
Regarde donc les possibilités de ton éditeur de texte préféré...
Perso je sauvegarde en UTF-8 NOBOM
[EDIT 15:20] HTML
Bien sûr le code html doit lui aussi être sauvegardé UTF-8 NOBOM
et comporter :
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
Il doit y avoir des choses similaires à prévoir si tu utilises PHP et autres langages...
Je ne suis pas certain que ça te soit utile !
C'est par solidarité car j'ai beaucoup galéré moi-même...
Bon courage
Partager