Salut,
Je travail actuellement sur l'analyse d'une page HTML, j'ai besoin de récupérer les "summary" de google. J'ai donc la page.
Ce qui m'intéresse se trouve entre les balises <div class=g> et </div>.
J'avais pensé dans un premier temps à faire: ($page contient la page HTML)
my @tab = ($page =~ m/<div class =g>[^<]*<\/div/gi;
mais ça ne marche pas si entre les balises <div class=g> et </div>, deux autres balises.
J'avais donc pensé à modifier mon regex en:
my @tab = ($page =~ m/<div class=g>[^(<\/div>)]*</div>/gi;
qui ne semble pas marcher, j'aurais donc aimé avoir plus d'information sur le [^]. Comment lui dire tout, à part la chaine </div>.
Sinon, comment faire pour extraire dans un tableau les informations qui m'intéresse ?
V'là si quelqu'un pouvait m'aider je lui en serais reconnaissant sur 4 générations.
Partager