Bonjour à tous,

Je me trouve face à un problème que je n'arrive point à résoudre concernant la composition d'un regex.

J'aimerai en effet pouvoir sélectionner des informations qui se trouvent entre des balises <th></th> d'un grand tableau, mais sans sélectionner, dans ces balises <th></th> le contenu des autres balises qui s'y trouvent.

Pour plus de clarté, voici un petit exemple de ce j'ai avant traitement :
Code html : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
<tr>
            <th>Info 1</th>
                <th>
                <a href="http://www.monsite.com">
        <img src="http://www.monsite.com/image.gif"/>
        </a>
                &nbsp;
        </th>
        <th>Info 2</th>
 
        <th>Info 3</th>   
       </tr>

Et voici ce que j'aimerai avoir après traitement :

Code html : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
<th>Info 1</th>
<th>Info 2</th>
<th>Info 3</th>


J'aimerai donc pouvoir récupérer Info 1, Info 2 et Info 3 situés à l'intérieur des balises <th></th>, mais pas le contenu des autres balises se trouvant elles mêmes à l'intérieur de balises <th></th> (comme le contenu des balises <a> et <img>).


Voici le code que j'ai pour l'instant, mais qui ne fonctionne que partiellement. En effet, il sélectionne tout ce qui se trouve entre les balises <th></th>, même le contenu des balises non désirées.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
preg_match_all("!<th.*?>(.*?)</th>!is",$texte,$tab_th)
Et voici ce que je récupère avec ce regex :

Code html : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
<th>Info 1 </th>
         <th>Info 2</th>
<th>
<a href="http://www.monsite.com">
<img src="http://www.monsite.com/image.gif"/>
</a>
&nbsp;
</th>
<th>Info 3</th>



J'espère avoir été assez clair.

Merci par avance pour votre aide.