Bonjour à tous,
je suis plutôt novice en perl et je rencontre actuellement un problème avec un
programmme de pattern matching.
Mon point de départ est une liste de termes complexes que je dois repérer dans un corpus. Jusque là, pas de souci, mon prog repère les termes. Mais mon but n'est pas de les extraire mais de les baliser dans le corpus lui même et là je sèche.
Si quelqu'un a une idée ce serait super.
Merci d'avance
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21 open (TERMES, "termes.txt") or die "Termes introuvables"; foreach $ligne (<TERMES>){push @termes, $ligne} foreach(@termes) { pluriels($_); chomp($_); #s/\r//; push @termes_plur, $_; } @termes_plur = sort{length($b) <=> length($a)} @termes_plur; open (FICHIER, "corpus.txt") or die "Fichier d'entrée introuvable"; push @fichier, <FICHIER>; foreach $terme (@termes_plur) { foreach(@fichier) { while(/($terme)/g){print $terme."\t".$1."\n"} } }
Partager