Alors je vous expose mon problème.
J'ai toujours tendance à penser "bah, ça sera tout simple comme problème", et je change vite d'avis .
Je bosse depuis plusieurs heures sur une regexp qui pourrait me permettre de nettoyer (entendons par là débaliser) une page HTML.
Jusque là, rien de bien méchant :
Avec quelques petites modifications, mais l'idée est là.
Code : Sélectionner tout - Visualiser dans une fenêtre à part s/(<.*?>)/ /g
Maintenant, je veux faire la même chose mais en conservant quelques balises comme le gras et l'italique.
Et pour compliquer le tout, je cherche à ce que l'ordre soit conservé.
J'avais pensé à :
Mais le problème est que toute balise qui contient 'b' ou 'i' (comme <base> par exemple) sera conservée par la même occasion.
Code : Sélectionner tout - Visualiser dans une fenêtre à part s/(<[^bi].*?>)/ /g
Je n'aurais pas demandé votre aide si je n'avais pas passé mon après-midi dessus (entre autres).
Merci d'avance!
Partager