Bonjour, et merci d'avance pour votre aide !
Je cherche à écrire un programme en Perl me permettant d'extraire le texte entre chaque balises html.
Pour ce que j'ai écrit pour l'instant, perl n'arrive pas a extraire la totalité du contenu (je pense qu'il bug avec la balise <a href> mais je ne vois pas comment contourner ce problème) :
Voici mon html d'exemple :open(TEXTE,"home.html") ;
while ($ligne = <TEXTE>)
{
if ($ligne=~/<(.*?)>(.*?)<\/(.*?)>/)
{
print "$2\n";
}
}
close(TEXTE);
Merci !<html>
<head>
<title>Blabla</title>
</head>
<body>
<p><a href="https://en.wikipedia.org">Il</a> était une fois.</p>
<p>Bla bla</p>
</body>
</html>
Partager