Salut à tous,

J'aimerais pouvoir supprimer les balises html d'un texte saisi mais cela en évitant de supprimer des balises du type "<robert>" ou "<alex>" par exemple. Pour cela j'ai fait ce code là :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
 
Pattern mask = Pattern.compile(Constant.getHTML_REGEX());
Matcher matcher = mask.matcher(this.helper.getNewComment());
this.setText(matcher.replaceAll(""));
avec comme regex :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
String HTML_REGEX = "(<\\s*/?\\s*)(a(bbr|cronym|ddress|pplet|rea)?|b(ase(font)?|do|ig|lockquote|ody|r|utton)?|c(aption|enter|ite|(o(de|l(group)?)))|d(d|el|fn|i(r|v)|l|t)|em|f(ieldset|o(nt|rm)|rame(set)?)|h([1-6]|ead|r|tml)|i(frame|mg|n(put|s)|sindex)?|kbd|l(abel|egend|i(nk)?)|m(ap|e(nu|ta))|no(frames|script)|o(bject|l|pt(group|ion))|p(aram|re)?|q|s(amp|cript|elect|mall|pan|t(r(ike|ong)|yle)|u(b|p))|t(able|body|d|extarea|foot|h|itle|r|t)|u(l)?|var)(\\s)*(/?)(\\s)*>";
Pour séparer les balises, ça fonctionne bien, seul problème c'est lors d'un ajout d'une propriétés.. par exemple un simple "<a href="" >" passe le match...

Avez vous une idée de comment supprimer les balises + leur propriétés tout en laissant les autres du genre "<robert>" ou "<a b c d>" ?

Merci d'avance pour vos réponses !