Bonjour tout le monde,

Je suis étudiante en 5ème année d'ingénieur et je prépare mon mémoire de fin d'études sur l'indexation des documents XML. Au fait, je dois implémenter la solution proposée par mon promoteur. J'ai lu plusieurs tutoriels sur jdom mais je n'arrive toujours pas à commencer à programmer.
J'ai un document XML quelconque (dont je ne connaît pas la structure). Je dois récupérer sa structure de manière à ce qu'un même chemin n'apparaisse qu'une seule fois. Je vais vous présenter un exemple pour éclaircir les choses:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
- <doc>
-     <a>
-       <b>
          <c>texte</ c>
     </b>
  </a>
- <e>
       <f>texte</ f>
  </e>
- <a>
-      <b>
         <d>texte</ d>
    </b>
  </a>
</doc>
Je dois obtenir:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
<index>
    <a>
        <b>
          <c> 2 </c> le 2 représente le nombre de fois qu'un chemin apparaît dans le document
        </b>
    </a>
 
    <e>
       <f> 1 </ f>
   </e>
</index>
Le problème est que je ne sait pas comment faire pour récupérer les chemins un par un et les enregistrer dans un nouveau document. De plus, avant d'insérer un chemin dans l'index, il faut d'abord le comparer à ceux déjà présents dans l'index pour éviter de le recréer s'il existe déjà.


J'espère que j'ai été assez claire dans mes explications et que vous pourrez m'aider. Il ne me reste plus beaucoup de temps et je n'arrive pas à démarre.
Bonne journée à tous et merci.