Bonjour,
Existe t-il un module (type Spreadsheet:ParseExcel pour excel) pour lire un word et retrouver des termes spécifiques ?
Merci de votre aide. Je n'ai rien trouvé sur le net.
Version imprimable
Bonjour,
Existe t-il un module (type Spreadsheet:ParseExcel pour excel) pour lire un word et retrouver des termes spécifiques ?
Merci de votre aide. Je n'ai rien trouvé sur le net.
Peut-être ce module CPAN:
Je ne l'ai pas essayé, mais il a l'air de faire ce que tu recherches.Code:Text::Extract::Word
Merci j'essaierai bientôt pour voir si cela fonctionne.
L'idée est la suivante :
- identifier le préfixe d'un nom (exemple : exi) :
* Exi-toto1
* Exi-toto2
* Exi-toto3
* ...
- Si je trouve le préfixe Exi, j'enregistre tout le mot (Exi-toto1, Exi-toto2
...) dans une case d'un fichier excel.
Le module cité permet de lire le document Word un peu comme si c'était un pur fichier texte.
La recherche de tes préfixes et la récupération de ce qui suit les préfixes en question, ça, tu vas devoir le coder toi-même.
Si tu récupères une ligne de texte dans la variable $ligne, tu peux essayer quelque chose comme cela:
Bien sûr, c'est juste l'idée de base, il faudra sans doute affiner selon ta tête de ton fichier word.Code:my $mot = $1 if $ligne =~ /(exi[-\w]+)/; #reconnaît "exi" suivi de lettres et/ou tirets (mais pas espaces ou ponctuations)
Merci pour ton aide. Je n'aurais pas le temps d'essayer ce week end mais je te tiens au courant prochainement. Tu m'as donné une bonne piste.