Expression régulière pour nettoyer HTML
Salut,
J'essaye de coder une méthode qui nettoie une String contenant de l'HTML selon plusieurs critères.
Je bute sur 1 chose, je voudrais déplacer le texte contenu entre deux items de liste (entre </li> et <li>) dans le <li> précedent, exemple:
Code:
1 2 3 4 5 6 7
| <ul>
<li>texte1 ok</li>
texte2 pas ok
<li>texte3 ok</li>
texte4 pas ok
<li>texte5 ok</li>
</ul> |
doit devenir
Code:
1 2 3 4 5
| <ul>
<li>texte1 oktexte2 pas ok</li>
<li>texte3 oktexte4 pas ok</li>
<li>texte5 ok</li>
</ul> |
J'essaye avec les classes Pattern et Matcher mais je n'arrive à le faire que quand il y a 1 seul texte pas ok, je pense que ça vient d'un problème de greedy/reluctant. Pour info le texte contenu entre les items peut contenir n'importe quoi (même du HTML)...
Merci d'avance.