J'ai un gros problème de regexp , je les utilisent pour nettoyer du texte mais les lettre non ASC-II comme é à sont supprimé .
voici mon script de teste
De plus le problème est que le texte n'est pas forcement en français mais en allemand , chinois etc ..
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9 #!/usr/bin/perl -w my $m = " métà è à ô î û â !!!!!!!!!!!!!!!!!!!!!!!!!!! --------- ?? welcome to jamrock \" 0 1 2 3 4 5 6 7 8 9 158895 ¦ [maison] <> < q< >>>> {google}² & ~ # ' { ( [ - | ` _ \ ^ @ ] ° ) = } + - * / ¨ $ £ ¤ µ % ! § : ; . , ? "; $m = quotemeta($m); $m =~ s/\W/ /gi; $m =~ s/\d/ /gi; $m =~ s/_/ /g; $m =~ s/^\s+//g; $m =~ s/\s+/ /g; print "$m\n"
Auriez vous une solution ?
Partager