|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | ||||
|
Invité régulier
![]() Inscription : mars 2002 Messages : 17 ![]() |
Bonjour,
Je cherche a faire une regex qui pourrait extraire le contenu de toutes les cellules (balises td ou th) d'une page html. En fait la page peut avoir des cellules qui contiennent elles mêmes des tableaux (et donc des cellules aussi). Ex de code Html : Code :
Code :
J'ai essayé l'expression : Mais ça ne marche pas s'il y a un tableau dans la cellule, car il me retourne le premier </td> trouvé mais qui ne correspond pas à la fin du <td> rencontré au début. Je pense que l'expression pourrait s'écrire en français comme : Une chaine commençant par une balise td, suivi par des caractères et éventuellement du couple <table></table> qui comprendrait un certain nombre de caratères au milieu et serait répété 0 fois ou plus et qui finirait par </td> Le fait d'avoir le(s) couple(s) <table></table> assurerait de trouver la bonne fin de cellule je pense, mais comment écrire cela ?? |
||||
|
|
00
|
|
|
#2 |
|
Membre Expert
![]() ![]() Mathieu ROBINDéveloppeur Web Inscription : mai 2006 Messages : 1 116 ![]() |
Oui et non. Parce que tu considères que tu ne gérerais qu'un seul niveau de profondeur. C'est pas optimal si tu ne sais pas quelle profondeur tu as à traiter.
Essaie plutôt avec une fonction PHP récursive. |
|
00
|
Copyright © 2000-2012 - www.developpez.com