Probleme de regxp et algo
J'ai un série de dictionnaires dans un dossier , je doit les nettoyer pour en supprimer les caactères isolé et toute ponctuation ainsi que les caractères spéciaux, de plus s'agissant de fichier de traduction je doit supprimé une ligne sur deux des dictionnaires :twisted: .
voici le script que je me suis fait pour nettoyer tout sa
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
| #!/usr/bin/perl
$l = "./";
@dics = open_dir($l);
foreach my $dics ( @dics )
{
open (FILE, "$dics") || die "impossible to open $dics $!";
$ligne_dico = <FILE>;
close (FILE);
$ligne_dico =~ s/\S+/ /;
$ligne_dico =~ s/\s\w{1,2}\s/ /gi;
$ligne_dico =~ s/\{\}\[\]\(\)\^\$\.\|\*\+\?\\/\n/g;
$ligne_dico =~ s/¨|!|:|,|;|"|~|-|#|'|`|_|\\|@|°|=|£|¤|%|µ|§/\n/g;
$ligne_dico =~ s/\S+/ /;
@mots_dico = split(/\n/,$ligne_dico);
open FILE, "> $dics" or die "$dics : $!\n";
print FILE "@mots_dico";
close FILE;
}
sub open_dir
{
my $dir_op = shift;
my $repertoire = "$dir_op";
my(%mtime);
my(@ficpl);
opendir (DIR, "$repertoire") || die ("can't open $repertoire");
@ficpl = grep {
/\.(txt)$/i && ($mtime{$_} = (stat ("$repertoire\\$_"))[9]);
}
readdir (DIR);
closedir DIR;
return @ficpl;
} |
Malheuresement il ne marche qu'a moitié car les fichiers que j'ai sont un peu bizare quand je les ouvre avec notepad2 il y écrit NULL en fond noir de plus les mots de sont pas rangé comme suit
alors que mon scripte est censé le faire.
Mici :wink: