Bonjour,
je suis sur un projet où l'on parse un fichier xml.
Pendant l'opération de parsing, il est arrivé qu'un élément soit séparé en deux pour donner deux éléments distincts dans la hashmap (débuggué via Eclipse).
Schématisation :
<monElement>valeur1</monElement>
le parsing de cet élément donne au final dans la hashmap quelque chose équivalent à ça si on reconvertissait en xml:
1 2
| <monElement>val</monElement>
<monElement>eur1</monElement> |
J'ai donc fait un essai en modifiant le xml par l'éditeur VI sous UNIX de la manière suivante :
<monElement>bonjourvaleur1</monElement>
Et le résultat équivalent (toujours dans la hashmap) était :
1 2
| <monElement>bon</monElement>
<monElement>jourvaleur1</monElement> |
Autrement dit la séparation de l'élément s'est faite entre le 3ème et le 4ème caractère encore une fois.
Donc pour résoudre mon problème immédiat, il m'a suffit de supprimer la ligne au comportement indésiré par exactement la même ligne, entièrement retapée.
Cependant ma question est de savoir pourquoi le parser a eu un tel comportement pour éviter de rencontrer le même problème à d'autres endroits.
Est-ce dû à un mauvais fichier xml? ou un mauvais caractère caché? (du même genre que le ^M entre Windows et Unix, mais autre encore)
Partager