bonjour,
je souhaite parsé du html mais je bloque pour récupéré les url et un élément imbriqué dans un tableau.
j'essaie de capturer les url
<a href="/annonce_657.php?idAnnonce=98640" title="vends voiture" name="id257840">voiture à vendre</a>
seul la variable idAnnonce change.
ceci ne fonctionne pas
preg_match('#"/(.*)"#', $val, $match)
je bloque aussi pour récupérer le texte entre les balises td sans le formatage (saut de ligne, balise, etc) exemple:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
| <tbody>
<tr>
<th align="left">description</th>
</tr>
<tr>
<td>
<!-- google_ad_section_start -->Bonjour.<br/><br/>
voiture à vendre, bon état général. 150 000km à voir<!-- google_ad_section_end -->
<hr/>photo possible sur demande.<br/>
Prévoir quelque frais.<br/>
Control tecnique ok
</td>
</tr>
<tr>
<td align="right">
<b>annonce n°23278</b>
</td>
</tr>
</tbody> |
j'ai donc tester
1 2 3 4 5
| preg_match("/(<([\w]+)[^>]*>)([^<]*)(<\/\\2>)/", $inp, $match
preg_match("#<th align=\"left\">description</th><p>(.*)</p>#", $inp, $match)
preg_match('/</th></tr><tr><td>(.*)</td>/', $inp, $match) |
merci pour votre aide
Partager