Bonjour,
je monte un script qui me permet de supprimer d'un site tous les liens sortants vers un NDD domain.tld
j'ai tenté la regex suivante :
Pourquoi le premier .*? ???
Code : Sélectionner tout - Visualiser dans une fenêtre à part preg_match('#<a.*?href=\"http:\/\/www.domain.tld.*?\".*?>(.*?)<\/a>#', $content, $out);
Pour pouvoir gérer les cas où l'attribut title ou class du lien est placé entre le <a et le href.
Tout marche bien sauf dans les textes où plusieurs liens sont présents, car le premier .*? me prend tout le code compris entre l'ouverture du premier <a et le href du dernier lien vers domain.tld
Je bloque depuis hier. Merci pour votre aide.
Partager