IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Format d'échange (XML, JSON...) Java Discussion :

Mauvaise récupération du contenu des balises [SAX]


Sujet :

Format d'échange (XML, JSON...) Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    DC
    DC est déconnecté
    Membre averti
    Inscrit en
    Janvier 2005
    Messages
    15
    Détails du profil
    Informations forums :
    Inscription : Janvier 2005
    Messages : 15
    Par défaut Mauvaise récupération du contenu des balises
    Bonjour,
    J'ai un parseur SAX qui me pose quelques problèmes.
    Sur une machine X pas de problème, en revanche si je passe sur la machine Y,
    il ne récupère pas tout le contenu contenu entre les balises.

    ex:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <chaine>Eurosport</chaine>
    Le parseur en va ressortir que "sport" par exemple.

    Une solution, que j'avais envisagé était de changer le parseur, j'utilise depuis Xerces que j'appelle de la manière suivante
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    	if(System.getProperty("org.xml.sax.driver")==null)
    							    System.setProperty("org.xml.sax.driver", "org.apache.xerces.parsers.SAXParser");
    Mais en passant à une machine Z ça marchait plus

    Alors dernière technique mise en place, lors de l'appel à la fonction characters

    je rajoute une petite partie de code pour reconstitué le texte
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    	public void characters(char[] chars, int start, int len)throws SAXException
    	{
    		_tmpString = new String(chars, start, len);
    		
    		if(balise.equalsIgnoreCase("chaine")) {
    			baliseTemp += _tmpString;
    		}
    		
    		if(_display) {
    			System.out.println(_tmpString);
    			_display = false;
    		}
    	}
    Et là ça fonctionne, mais j'ai pas envie de devoir faire ça pour toutes les balises que je dois traiter (une cinquantaine).

    Y-a-til un moyen d'être sur que j'utilise Xerces comme parseur ?

    Y-a-t il une autre solution à ce problème ?

    Merci

  2. #2
    Membre Expert
    Avatar de gifffftane
    Profil pro
    Inscrit en
    Février 2007
    Messages
    2 354
    Détails du profil
    Informations personnelles :
    Localisation : France, Loire (Rhône Alpes)

    Informations forums :
    Inscription : Février 2007
    Messages : 2 354
    Par défaut
    Attention que le callback characters de sax est assez piégé ; les précautions à prendre sont infinies. Tu trouveras quelques pistes à Lecture d'un flux XML via SAX ou Top Ten SAX2 Tips.

  3. #3
    DC
    DC est déconnecté
    Membre averti
    Inscrit en
    Janvier 2005
    Messages
    15
    Détails du profil
    Informations forums :
    Inscription : Janvier 2005
    Messages : 15
    Par défaut
    Merci, je vais me pencher la dessus.

    Il n'y a pas d'autres moyens de récupérer le contenu d'une balise ?

  4. #4
    DC
    DC est déconnecté
    Membre averti
    Inscrit en
    Janvier 2005
    Messages
    15
    Détails du profil
    Informations forums :
    Inscription : Janvier 2005
    Messages : 15
    Par défaut
    Voilà, j'ai résolu le problème en suivant les conseils du 2° lien.

    Il faut utiliser un stringBuffer pour récupérer le texte

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    class MyHandler implements ContentHandler {
    	private StringBuffer chars = new StringBuffer ();
     
    	public void characters (char buf [], int offset, int length)
    	throws SAXException
    		{ chars.append (buf, offset, length); }
     
    	private String getCharacters ()
    	{
    		String retval = chars.toString ();
    		chars.setLength (0);
    		return retval;
    	}
     
    }
    Attention: l'appel à getCharacters vide le buffer donc n'oubliez pas de passer par une variable intermédiaire si vous avez besoin du résultat plusieurs fois.
    De plus, il ne faut pas oublier de vider le buffer si vous ne vous intéressez pas à toutes les balises de votre document XML.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [RegEx] Réduire mon texte au contenu des balises h2
    Par shinji_rem dans le forum Langage
    Réponses: 1
    Dernier message: 27/03/2007, 11h29
  2. [PHP-JS] Extraire le contenu des balises title
    Par renaud26 dans le forum Langage
    Réponses: 5
    Dernier message: 24/10/2006, 15h23
  3. [Forum] Le contenu des balises code a changé
    Par LedZeppII dans le forum Mode d'emploi & aide aux nouveaux
    Réponses: 5
    Dernier message: 15/10/2006, 13h58
  4. Extraire le contenu des balises XML
    Par calimero2611 dans le forum Modules
    Réponses: 7
    Dernier message: 12/06/2006, 15h09
  5. [HTML] affichage du contenu des balises 'alt' dans une iframe
    Par etarip dans le forum Balisage (X)HTML et validation W3C
    Réponses: 6
    Dernier message: 11/08/2005, 14h08

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo