Bonjour,

je cherche a extraire des donnees d'une page HTML en utilisant une expression reguliere.

<TD style="BORDER-BOTTOM: #eeeded 1px solid; BORDER-LEFT: #eeeded 1px solid; PADDING-BOTTOM: 1px; PADDING-LEFT: 1px; PADDING-RIGHT: 1px; COLOR: #808080; BORDER-TOP: #eeeded 1px solid; BORDER-RIGHT: #eeeded 1px solid; PADDING-TOP: 1px" bgColor=#f9f8f6 colSpan=4>NOTES</TD></TR>
<TR>
<TD colSpan=4>
<DIV>ICI MON TEXTE</DIV></TD>
Ce pattern
Code : Sélectionner tout - Visualiser dans une fenêtre à part
^<TD\sstyle=.*NOTES</td>.*\r\n.*\r\n.*<TD colSpan=4>\r\n<DIV>.*</TD>
fonctionne plutot bien avec le HTML ci-dessus.

Par contre, sur la meme page, j'ai un autre bout de texte qui m'interesse :
<td colspan="4" bgcolor="#F9F8F6" style="border:#EEEDED 1 solid;color:#808080;padding:1">NOTES</td>
</tr><tr>
<td colspan="4"><div>ICI MON TEXTE 1<br />ICI MON TEXTE 2</div>
<div>ICI MON TEXTE 3</div>
<div><br />ICI MON TEXTE 4</div></td>
</tr>
Et mon pattern ne fonctionne alors que sur la premiere ligne, malgre l'option MultiLines activee. Il est possible de forcer le passage sur plusieurs lignes avec
Code : Sélectionner tout - Visualiser dans une fenêtre à part
^<TD\sstyle=.*NOTES</td>.*\r\n.*\r\n.*<TD colSpan=4>\r\n<DIV>(.|\n)*</TD>
mais le resultat englobe alors l'ensemble de ma page HTML jusqu'a la derniere balise </TD> et non pas la premiere rencontree.
Si quelqu'un peut m'eclairer sur ce sujet, ca m'enleverait une poutre du pied

Bonne journée!