Précédent   Forum des professionnels en informatique > PHP > Langage > Regex
Regex Forum d'entraide sur les expressions rationnelles PHP. Avant de poster -> FAQ regex, Cours de regex et Sources de regex
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 12/04/2007, 19h13   #1
Futur Membre du Club
 
Inscription : septembre 2005
Messages : 29
Détails du profil
Informations forums :
Inscription : septembre 2005
Messages : 29
Points : 17
Points : 17
Par défaut Extraire une URL en excluant certaines extensions



Bon voila j'ai une REGEX bien sympa qui me permet d'extraire les liens d'une page

Code :
1
2
	"/(?:(?:src|href|url)\s*[=\(]\s*[\"'`])".
   			"([\+\w:?=@&\/#._;-]+)(?:[\s\"'`])/i"
neanmoins je me suis aperçu qu'un certain nombre d'extensions ne me servaient à rien et pour allèger le script il conviendrait de les eliminer.

Donc j'essaye de rassembler mes esprit et je modifie la REGEX comme il suit

Code :
1
2
3
 
"/(?:(?:src|href|url)\s*[=\(]\s*[\"'`])".
   			"((?!(gif|jpg|doc|xls|pdf))[\+\w:?=@&\/#._;-]+)(?:[\s\"'`])/i"
Malheuresement cela continue de me sortir tout les liens sans entraver les extensions mentionnées.

Une aide serait la bienvenue car je seche un peu....
marciv est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 13/04/2007, 01h09   #2
Membre habitué
 
Avatar de daniel61
 
Inscription : décembre 2006
Messages : 109
Détails du profil
Informations forums :
Inscription : décembre 2006
Messages : 109
Points : 120
Points : 120
Citation:
Envoyé par marciv
Code :
1
2
3
 
"/(?:(?:src|href|url)\s*[=\(]\s*[\"'`])".
   			"((?!(gif|jpg|doc|xls|pdf))[\+\w:?=@&\/#._;-]+)(?:[\s\"'`])/i"
dans une prochaine vie, tu m'expliqueras l'intérêt de src et url si tu ne veux pas d'images

pour l'expression, 2 fois rien, parenthèses au mauvais endroit à mon avis.

Code :
1
2
3
 
"/(?:(?:src|href|url)\s*[=\(]\s*[\"'`])".
   			"((?:(?!\.gif|\.jpg|\.doc|\.xls|\.pdf)[\+\w:?=@&\/#._;-])+)(?:[\s\"'`])/isU"
j'ai ajouter \. pour ne pas détruire "gif.html" par exemple, et les options "s et U" sont à considérer sur du html.
daniel61 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 13/04/2007, 04h33   #3
Futur Membre du Club
 
Inscription : septembre 2005
Messages : 29
Détails du profil
Informations forums :
Inscription : septembre 2005
Messages : 29
Points : 17
Points : 17
Par défaut Danny the dog

Merci danny....

pour les url et scr c pour garder la trace dans la REGEX au cas ou je modifierai le script ultérieurement......pas très logique je sais
marciv est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 13h28.


 
 
 
 
Partenaires

Hébergement Web