|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Invité régulier
![]() Inscription : janvier 2009 Messages : 60 ![]() |
Bonjour,
J'avoue me perdre un peu dans les regex... J'aimerais parser une page web et récupérer plusieurs éléments identifiables en fonction de leur emplacement dans la page. Par exemple, pour une même page, récupérer tout ce qui est contenu entre : et sachant qu'il y a un saut de ligne mais à priori sans espace entre alt> et </a>. alt> correspond à la fin d'un code html d'image (<img src="url" alt>) Ensuite, pour ce bloc de page récupérer, j'aimerais à nouveau au sein de ce bloc parser des éléments contenus entre certaines balises. Merci par avance pour votre aide ! |
|
|
00
|
|
|
#2 |
![]() ![]() Inscription : septembre 2010 Messages : 7 219 ![]() |
y'a plein de sujets la dessus et tu me verras dire à chaque fois :
pour parser du HTML c'est DOMDocument
__________________
http://blog.stealth35.com/ |
|
|
00
|
|
|
#3 | ||
|
Invité régulier
![]() Inscription : janvier 2009 Messages : 60 ![]() |
ok pour le parsing, je vais regarder cela même si je ne capte pas grand chose...
pour les regex, par contre, j'ai bien lu la doc ici (http://php.developpez.com/sources/?page=regexp) mais je ne comprends pas pourquoi ceci ne retourne rien : Code :
|
||
|
|
00
|
|
|
#4 |
![]() ![]() Inscription : septembre 2010 Messages : 7 219 ![]() |
quitte a pas comprendre autant faire les choses en plus propre et utilise DomDocument
__________________
http://blog.stealth35.com/ |
|
|
00
|
|
|
#5 | |
|
Expert Confirmé
![]() ![]() |
Citation:
![]() T'as une touche spéciale sur ton clavier ?
__________________
# Dans la Création, tout est permis mais tout n'est pas utile... |
|
|
01
|
|
|
#6 | |
![]() ![]() Inscription : septembre 2010 Messages : 7 219 ![]() |
Citation:
__________________
http://blog.stealth35.com/ |
|
|
|
01
|
|
|
#7 | ||
|
Membre du Club
![]() Boris conception et traitement de documents xhtml Inscription : août 2011 Messages : 107 ![]() |
Citation:
Citation:
En fait, pour parser n'importe code de type xml, qu'il soit html ou non, il faut utiliser DOMDocument, qui est une approche nettement plus rigoureuse et plus riche que de parser par regex, ces dernières devant être réservées à la seule analyse des noeuds texte terminaux. (L'effort de mise à niveau est certes plus conséquent. Par contre, une fois qu'on a "capté", on ne peut plus s'en passer...) |
||
|
|
00
|
|
|
#8 | |
|
Membre du Club
![]() Boris conception et traitement de documents xhtml Inscription : août 2011 Messages : 107 ![]() |
Citation:
|
|
|
|
00
|
|
|
#9 | |
![]() ![]() Inscription : septembre 2010 Messages : 7 219 ![]() |
Citation:
__________________
http://blog.stealth35.com/ |
|
|
|
00
|
Copyright © 2000-2012 - www.developpez.com