J'ai un document html que je souhaite convertir en doc Dom4J.

J'ai eu l'erreur suivante
org.dom4j.DocumentException: Error on line 1 of document : Reference is not allowed in prolog. Nested exception: Reference is not allowed in prolog.
at org.dom4j.io.SAXReader.read(SAXReader.java:482)
at org.dom4j.DocumentHelper.parseText(DocumentHelper.java:278)
at MonTest.main(MonTest.java:21)
Nested exception:
org.xml.sax.SAXParseException: Reference is not allowed in prolog.
C'était un "&" qu'il fallait échapper en & amp; pour construire le document.

En XML, il semblerait qu'il y ait 5 caractères à échaper: (gt, lt, quot, amp, apos)

Néanmoins, Comment les échapper sans le faire dans les noeuds des éléments:

Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <div id="test" class='toto'>A&A<A"A</div>
doit donner:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
 
    <div id="test" class='toto'>A&amp;A&lt;A&quot;A</div>
et non:

Code : Sélectionner tout - Visualiser dans une fenêtre à part
    &lt;div id=&quot;test&quot; class=&apos;toto&apos;&gt;A&amp;A&lt;A&quot;A&lt;/div&gt;
Merci,