J'ai un série de dictionnaires dans un dossier , je doit les nettoyer pour en supprimer les caactères isolé et toute ponctuation ainsi que les caractères spéciaux, de plus s'agissant de fichier de traduction je doit supprimé une ligne sur deux des dictionnaires .

voici le script que je me suis fait pour nettoyer tout sa



Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
#!/usr/bin/perl
 
$l = "./";
 
@dics = open_dir($l);
 
 
foreach my $dics ( @dics )
{
  open (FILE, "$dics") || die "impossible to open $dics $!";
  $ligne_dico = <FILE>;
  close (FILE);
 
 
 
     $ligne_dico =~ s/\S+/ /;
	 $ligne_dico =~ s/\s\w{1,2}\s/ /gi;
	 $ligne_dico =~ s/\{\}\[\]\(\)\^\$\.\|\*\+\?\\/\n/g;
	 $ligne_dico =~ s/¨|!|:|,|;|"|~|-|#|'|`|_|\\|@|°|=|£|¤|%|µ|§/\n/g;
	 $ligne_dico =~ s/\S+/ /;
 
 
     @mots_dico = split(/\n/,$ligne_dico);
 
 
 
    open FILE, "> $dics" or die "$dics : $!\n";
    print FILE "@mots_dico";
    close FILE;
 
}
 
 
 
 
sub open_dir
{
  my $dir_op = shift;
  my $repertoire = "$dir_op";
  my(%mtime);
  my(@ficpl);
  opendir (DIR, "$repertoire") || die ("can't open $repertoire");
  @ficpl = grep {
     /\.(txt)$/i && ($mtime{$_} = (stat ("$repertoire\\$_"))[9]);
  }
  readdir (DIR);
  closedir DIR;
  return @ficpl;
}
Malheuresement il ne marche qu'a moitié car les fichiers que j'ai sont un peu bizare quand je les ouvre avec notepad2 il y écrit NULL en fond noir de plus les mots de sont pas rangé comme suit

alors que mon scripte est censé le faire.

Mici