J'ai un gros problème de regexp , je les utilisent pour nettoyer du texte mais les lettre non ASC-II comme é à sont supprimé .

voici mon script de teste

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
#!/usr/bin/perl -w
my $m = " métà è à ô î û â !!!!!!!!!!!!!!!!!!!!!!!!!!! --------- ?? welcome to jamrock \" 0 1 2 3 4 5 6 7 8 9 158895 ¦ [maison] <> < q<  >>>> {google}² & ~ # ' { ( [ - | ` _ \ ^ @ ] ° ) = } + - * / ¨ $ £ ¤ µ % ! § : ; . , ? ";
   $m = quotemeta($m);
   $m =~ s/\W/ /gi;
   $m =~ s/\d/ /gi;
   $m =~ s/_/ /g;
   $m =~ s/^\s+//g;
   $m =~ s/\s+/ /g;
print "$m\n"
De plus le problème est que le texte n'est pas forcement en français mais en allemand , chinois etc ..

Auriez vous une solution ?