Regex pour parser une page web
Bonjour,
J'avoue me perdre un peu dans les regex...
J'aimerais parser une page web et récupérer plusieurs éléments identifiables en fonction de leur emplacement dans la page.
Par exemple, pour une même page, récupérer tout ce qui est contenu entre :
et
sachant qu'il y a un saut de ligne mais à priori sans espace entre alt> et </a>. alt> correspond à la fin d'un code html d'image (<img src="url" alt>)
Ensuite, pour ce bloc de page récupérer, j'aimerais à nouveau au sein de ce bloc parser des éléments contenus entre certaines balises.
Merci par avance pour votre aide !