IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Format d'échange (XML, JSON...) Java Discussion :

Lecture des caractères [SAX]


Sujet :

Format d'échange (XML, JSON...) Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Profil pro
    Inscrit en
    Mai 2004
    Messages
    118
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2004
    Messages : 118
    Par défaut Lecture des caractères
    Bonjour,

    J'ai un problème avec l'api Java Sax :

    Voici un bout de mon fichier Xml :

    Code XML : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    <lexicalEntry id="coronoïde_1">
    		<formSet>
    			<lemmatizedForm>
    				<orthography>coronoïde</orthography>
    				<grammaticalCategory>adjective</grammaticalCategory>
    			</lemmatizedForm>
    			<inflectedForm>
    				<orthography>coronoïde</orthography>
    				<grammaticalNumber>singular</grammaticalNumber>
    				<grammaticalGender>masculine</grammaticalGender>
    			</inflectedForm>
    			<inflectedForm>
    				<orthography>coronoïdes</orthography>
    				<grammaticalNumber>plural</grammaticalNumber>
    				<grammaticalGender>masculine</grammaticalGender>
    			</inflectedForm>
    			<inflectedForm>
    				<orthography>coronoïde</orthography>
    				<grammaticalNumber>singular</grammaticalNumber>
    				<grammaticalGender>feminine</grammaticalGender>
    			</inflectedForm>
    			<inflectedForm>
    				<orthography>coronoïdes</orthography>
    				<grammaticalNumber>plural</grammaticalNumber>
    				<grammaticalGender>feminine</grammaticalGender>
    			</inflectedForm>
    		</formSet>
    		<originatingEntry target="TLF">CORONOÏDE, adj.</originatingEntry>
    	</lexicalEntry>

    Je souhaite récupérer les orthographes, c'est à dire les valeurs entre les balises <orthography>.
    Pour cette exemple, il me sort :
    coronoïde
    coronoïde
    des
    coronoïde
    coronoïdes
    Le problème est pour le 3ème, il ne me donne que les trois derniers caractères.
    Cela est due à ma méthode :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
            public void characters(char[] ch, int start, int length) throws SAXException {
                    tempVal = new String(ch,start,length);
            }
    La taille du tableau ch est de 2048 caractères. Après avoir afficher des traces, il lit le mot "cornoïdes" dans 2 tableaux différents :
    "cornoï" start = 2037 length = 7
    "des" start = 0 length = 3
    et je ne récupère que la 2eme partie.

    Bref, je n'y comprends pas grand chose et ne sais pas pourquoi il lit le fichier comme cela....
    Peut être que me méthode pour lire n'est pas la bonne.

    Si quelqu'un peut m'aider... merci d'avance!

    Alex.

  2. #2
    Membre confirmé
    Profil pro
    Inscrit en
    Mai 2004
    Messages
    118
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2004
    Messages : 118
    Par défaut
    j'ai résolu mon problème...

    il faut en fait utiliser un buffer dans la méthode characters,

    comme dans la FAQ

    Le code que j'avais récupéré contenait donc un bug.

    Désolé.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Débutant] Lecture des caractères d'échappement en C++
    Par Lalanne dans le forum C++Builder
    Réponses: 3
    Dernier message: 28/10/2014, 20h38
  2. [Encodage] Optimisation lecture des caractères par le navigateur
    Par Tristan Zwingelstein dans le forum Balisage (X)HTML et validation W3C
    Réponses: 4
    Dernier message: 01/01/2013, 19h49
  3. Réponses: 3
    Dernier message: 30/05/2011, 11h51
  4. lecture d'un fichier avec des caractères spéciaux
    Par Invité dans le forum SAS Base
    Réponses: 24
    Dernier message: 20/01/2011, 09h50
  5. Lecture des caractères accentués dans un fichier
    Par albertgl dans le forum MATLAB
    Réponses: 15
    Dernier message: 04/03/2010, 15h35

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo