Besoin de précision sur Regex
Salut,
Je travail actuellement sur l'analyse d'une page HTML, j'ai besoin de récupérer les "summary" de google. J'ai donc la page.
Ce qui m'intéresse se trouve entre les balises <div class=g> et </div>.
J'avais pensé dans un premier temps à faire: ($page contient la page HTML)
my @tab = ($page =~ m/<div class =g>[^<]*<\/div/gi;
mais ça ne marche pas si entre les balises <div class=g> et </div>, deux autres balises.
J'avais donc pensé à modifier mon regex en:
my @tab = ($page =~ m/<div class=g>[^(<\/div>)]*</div>/gi;
qui ne semble pas marcher, j'aurais donc aimé avoir plus d'information sur le [^]. Comment lui dire tout, à part la chaine </div>.
Sinon, comment faire pour extraire dans un tableau les informations qui m'intéresse ?
V'là si quelqu'un pouvait m'aider je lui en serais reconnaissant sur 4 générations :mouarf:.