|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | ||
|
Futur Membre du Club
![]() Inscription : décembre 2003 Messages : 86 ![]() |
Comme l'indique le titre je souhaite utiliser une expression régulière très générique qui me permettrait, pour un contenu html donné incluant des balises ancre/lien, de récupérer à la fois les liens et leur contenu, que je pourrait traiter par ailleurs.
par exemple ces balises doivent être récupérées : Code :
du type Code :
<a( href="([^"]*)"){0,1}( id="([^"]*)"){0,1}( class="([^"]*)"){0,1}( title="([^"]*)"){0,1}>([^<]*){1}<\/a>
Je souhaiterais savoir s'il est possible de généraliser cette expression en cherchant les termes dans n'importe quel ordre. id, puis href, puis title puis class ou bien title puis id puis class puis href... merci d'avance |
||
|
|
00
|
|
|
#2 |
![]() ![]() R&D en systemes informatiques bas niveau Unix/Linux Inscription : mai 2004 Messages : 5 497 ![]() |
Bonjour,
C'est un parseur qu'il te faut, pas une regexp. Il existe des parseurs HTML sur le net, tu devrais pouvoir en trouver sans trop de soucis. |
|
|
00
|
|
|
#3 |
|
Futur Membre du Club
![]() Inscription : décembre 2003 Messages : 86 ![]() |
Certes, de la façon dont tu présentes les choses, mon but est de réinventer la roue.
) sont des classes bien lourdes (en poids).Mon but est de récupérer dans un tableau tous les éléments constitutifs de la balise ancre. Peut-être être une gageure de faire ça en une seule regexp. Mon niveau dans ce langage est bien trop faible pour me rendre compte si je fais fausse route ou si je suis proche du but. En tout cas merci d'avoir répondu |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com