Salut,
Je suis entrain de parser un fichier XML très large avec le SAX parser de JAVA. Le fichier est structuré comme suit :
Ma question est la suivante : je veut avoir les nombre de tous les `writtenForm` de l'élément `Lemma` qui ont plusqu'une seul mot classé selon leur `partOfSpeech`.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19 <?xml version="1.0" encoding="utf-8"?> <LexicalResource> <Lexicon label="Arabic" language="arb" languageCoding="UTF-8" owner="http://www.globalwordnet.org/AWN/" version="1.0"> <LexicalEntry id="$Ary_AlmtwsT_1"> <Lemma partOfSpeech="n" writtenForm="aaaa bbbbb"/> <Sense id="$Ary_AlmtwsT_1_mnTqp_$Ary_AlmtwsT_n1AR" synset="mnTqp_$Ary_AlmtwsT_n1AR"/> </LexicalEntry> <LexicalEntry id=" kiyoluw mitor_1"> <Lemma partOfSpeech="n" writtenForm=" ccccc ddddd"/> <Sense id=" kiyoluw mitor_1_kiyoluw_mitor_n1AR" synset="kiyoluw_mitor_n1AR"/> </LexicalEntry> <LexicalEntry id=" ZalomA'_1"> <Lemma partOfSpeech="n" writtenForm=" fffffff"/> <Sense id=" ZalomA'_1_ZalAam_n1AR" synset="ZalAam_n1AR"/> <WordForm formType="root" writtenForm="aze"/> </LexicalEntry> </Lexicon> </LexicalResource>
Partager