bonjour,

je souhaite parsé du html mais je bloque pour récupéré les url et un élément imbriqué dans un tableau.

j'essaie de capturer les url
Code : Sélectionner tout - Visualiser dans une fenêtre à part
<a href="/annonce_657.php?idAnnonce=98640" title="vends voiture" name="id257840">voiture à vendre</a>
seul la variable idAnnonce change.

ceci ne fonctionne pas
Code : Sélectionner tout - Visualiser dans une fenêtre à part
preg_match('#"/(.*)"#', $val, $match)
je bloque aussi pour récupérer le texte entre les balises td sans le formatage (saut de ligne, balise, etc) exemple:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
<tbody>
	<tr>
		<th align="left">description</th>
	</tr>
    <tr>
        <td>
			<!-- google_ad_section_start -->Bonjour.<br/><br/>
			voiture à vendre, bon état général. 150 000km à voir<!-- google_ad_section_end -->
            <hr/>photo possible sur demande.<br/>
			Prévoir quelque frais.<br/>
			Control tecnique ok                     
		</td>
	</tr>
    <tr>
		<td align="right">
			<b>annonce n°23278</b>
		</td>
	</tr>
</tbody>
j'ai donc tester
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
preg_match("/(<([\w]+)[^>]*>)([^<]*)(<\/\\2>)/", $inp, $match
 
preg_match("#<th align=\"left\">description</th><p>(.*)</p>#", $inp, $match)
 
preg_match('/</th></tr><tr><td>(.*)</td>/', $inp, $match)
merci pour votre aide