Bonjour,
Je cherche à découpé du code html que j'ai extrait depuis une page pour ne garder que les liens mais vu que ce qu'il y a avant et après les liens est variable je ne sais pas trop comment faire.
j'ai essyé avec plusieurs fonctions (str_replace, preg_replace, preg_match,...) mais je n'ai pas réussis à conserver uniquement l'adresse :/
Un exemple ne fera pas de mal.
je récupére ça :
<p>blablabla</p><a href='http://chemin/document.pdf'> document.pdf </a><p>blobloblo</p>
J'ai utilisé certaines fonctions citées plus haut pour supprimer les balises et j'obtiens ça :
blablabla http://chemin/document.pdf document.pdf blobloblo
Et en fait je voudrais pour mettre des conditions du genre tout ce qui est avant "http" et après ".pdf" je supprime pour ne garder que l'adresse propre du document.
Merci d'avance pour votre aide.
Partager