Bonjour à tous ,
Eternel débutant en perl, malgré le fait que j'ai déjà réalisé un ou deux programmes dans ce langage, je vous prie tout d'abord de m'excuser si ces questions semblent évidentes. Je tiens aussi à préciser que j'ai déjà effecuté
des recherches sur le forum / sur google pour trouver des informations... en vain.
En fait, je cherche à extraire des données placés entre des balises, dans une série de fichiers HTML. La structure des blocs dont je souhaite extraire les informations est composée ainsi :
1 2
| <a name="xxxxxxx"></a>Jean Louis [<b>MOD</b>], <i><a href="xxxxxxxxxxxxxxxxxxx"
>Ceci est un test</a></i> |
puis plus loin :
</td></tr></table><span class=head>TEST.</span>
et enfin :
1 2 3 4 5 6
|
</center><p>
""Tout un texte de plusieurs paragraphes ici""
<table width='100%'> |
Dans ce cas précis, je souhaiterais extraire et placer dans des variables A. "Jean Louis" ; B. "Ceci est un test" ; C. "TEST" et enfin D. L'ensemble du texte placé entre les deux balises.
Est-ce que cela est possible s'il vous plaît ? Faut-il un (des ?) modules complémentaire(s) ?
Enfin, j'aurais aimé savoir s'il vous plaît, si à l'ouverture d'un fichier, il était possible de "sauter" les 180 premières lignes pour ne commencer les recherches qu'à partir de ce point ?
En vous remerciant vivement pour toute aide.
Cordialement.
Partager