IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Format d'échange (XML, JSON...) Java Discussion :

Recherche un parser XML (très) "permissif"


Sujet :

Format d'échange (XML, JSON...) Java

  1. #1
    Nouveau Candidat au Club
    Profil pro
    Développeur Java
    Inscrit en
    Janvier 2008
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Développeur Java

    Informations forums :
    Inscription : Janvier 2008
    Messages : 2
    Points : 1
    Points
    1
    Par défaut Recherche un parser XML (très) "permissif"
    Comme tout le monde ne respecte pas les standards (), j'aurai besoin d'une implémentation de parser XML Java (jdk 1.5) relativement permissive... et performante

    Pour faire simple, j'ai besoin de parser un grand nombre de flux RSS de manière très régulière et il se trouve que ces flux ne sont pas nécessairement valides d'un point de vue XML (caractères accentués, mal encodés, non respect du schéma...). Cependant, comme je dois qd même extraire de l'info de ces flux, et afin de ne pas gérer les problèmes au niveau de mon appli ou développer mon propre parser, j'aimerais trouver un parser qui puisse être assez souple pour ne pas refuser d'analyser le pseudo XML que je lui donne.

    Des propositions?

  2. #2
    Rédacteur
    Avatar de CyberChouan
    Homme Profil pro
    Directeur technique
    Inscrit en
    Janvier 2007
    Messages
    2 752
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Directeur technique
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Janvier 2007
    Messages : 2 752
    Points : 4 314
    Points
    4 314
    Par défaut
    Pour ce qui est de trouver un parseur qui accepte les caractères accentués, je pense que tu trouveras ça sans problème. pour le non respect du schéma, tu peux désactiver la vérification également sur grand nombre de parseurs.

    Typiquement, je pense que JDom doit pouvoir répondre à ton besoin sur ces deux points.

    Par contre, je ne connais pas de parseur qui sera permissif au point d'accepter un xml mal formé (balises ouvertes qui ne sont pas fermées, etc.)
    Avant de poster, pensez à regarder la FAQ, les tutoriaux, la Javadoc (de la JRE que vous utilisez) et à faire une recherche
    Je ne réponds pas aux questions techniques par MP: les forums sont faits pour ça
    Mes articles et tutoriaux & Mon blog informatique

  3. #3
    Expert éminent
    Avatar de GrandFather
    Inscrit en
    Mai 2004
    Messages
    4 587
    Détails du profil
    Informations personnelles :
    Âge : 54

    Informations forums :
    Inscription : Mai 2004
    Messages : 4 587
    Points : 7 103
    Points
    7 103
    Par défaut
    Il n'existe pas de parseur XML "permissif" à l'instar des parseurs HTML implémentés dans les navigateurs actuels, la rigueur lexicale étant imposée par la spécification XML. D'un point de vue technique, pour un parseur XML, du XML mal formé n'est pas du XML. En conséquence, il sera incapable de le traiter et de le restituer sous forme événementielle (SAX) ou structurée (DOM).

    La seule solution pour traiter tes flux RSS "pourris" avec des performances acceptables et sans monter une usine à gaz est d'utiliser les expressions régulières.
    FAQ XML
    ------------
    « Le moyen le plus sûr de cacher aux autres les limites de son savoir est de ne jamais les dépasser »
    Giacomo Leopardi

  4. #4
    Nouveau Candidat au Club
    Profil pro
    Développeur Java
    Inscrit en
    Janvier 2008
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Développeur Java

    Informations forums :
    Inscription : Janvier 2008
    Messages : 2
    Points : 1
    Points
    1
    Par défaut
    Je comprends bien qu'un vrai parser XML ne gère pas du XML mal-formé, mais j'avais imaginé que certains parsers auraient pu proposer du parsing "at-all-costs"...

    Sinon, quelqu'un connaîtrait-il une API ou un framework me permettant de parser au mieux mes flux RSS non-conformes sans perdre trop de temps à réinventer la roue?

Discussions similaires

  1. Recherche d'un parser XML
    Par ludovic tambour dans le forum Composants VCL
    Réponses: 3
    Dernier message: 07/12/2005, 12h05
  2. [XML] recherche un parser cross platform : libXML2 ou Xerces ???
    Par baert dans le forum Autres éditeurs
    Réponses: 2
    Dernier message: 13/09/2005, 14h49

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo