IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Java Discussion :

Extraire une div d'un document HTML


Sujet :

Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Mai 2005
    Messages
    513
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2005
    Messages : 513
    Par défaut Extraire une div d'un document HTML
    Bonsoir a tous,

    Voila, je possède un document HTML que j'analyse. Je souhaite en extraire une div qui possède un id particulier pour le mettre dans une chaine (String).

    Jusqu'à maintenant, j'utilisais DOM pour effectuer les quelques traitements sur mon fichier. Je me rend compte, l'application tournant sur Android, que les performances en prennent un coup.

    Je sollicite donc votre aide pour que vous aiguillez sur la marche à suivre pour extraire une partie d'un document HTML de la manière la plus optimale.

    Merci par avance.

  2. #2
    Rédacteur/Modérateur
    Avatar de Logan Mauzaize
    Homme Profil pro
    Architecte technique
    Inscrit en
    Août 2005
    Messages
    2 894
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Architecte technique
    Secteur : Transports

    Informations forums :
    Inscription : Août 2005
    Messages : 2 894
    Par défaut
    Je connais pas l'API fournie par Android mais en général tu trouves 3 types d'API de manipulation XML : Objet, Evénement, Flux.

    Objet : c'est DOM, le document XML est représenté par des objets Java.

    Evénement : Dans Java SE, il s'agit de SAX. Tu as un handler qui traite le XML comme un listener. Ces méthodes sont appelées par le parser quand une balise s'ouvre/se ferme, il y a du texte, etc.

    Flux : Dans Java SE, il s'agit de StAX. Ca fonctionne un peu comme SAX, ça marche plutôt comme Scanner. Tu initialises le parser et ensuite tu lui demandes le prochain noeud qui t'interresse. Tu as ensuite des objets/méthodes pour récupérer l'information.

    Je suppose que l'API Android doit fournir un équivalent à ces trois types.

    Concernant l'utilisation d'HTML et d'un parser XML, ce n'est pas strictement compatible. HTML est issue de SGML une norme dont est également issue XML. Tout document XML est du SGML mais ce n'est pas vrai pour l'inverse. Ansi tout document HTML n'est pas du XML, pour ça il y a le XHTML.

    La grosse différence entre le SGML et le XML, c'est qu'en SGML la fermeture d'une balises n'est pas obligatoire.
    Java : Cours et tutoriels - FAQ - Java SE 8 API - Programmation concurrente
    Ceylon : Installation - Concepts de base - Typage - Appels et arguments

    ECM = Exemple(reproduit le problème) Complet (code compilable) Minimal (ne postez pas votre application !)
    Une solution vous convient ? N'oubliez pas le tag
    Signature par pitipoisson

  3. #3
    Membre éclairé
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Mai 2005
    Messages
    513
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2005
    Messages : 513
    Par défaut
    Merci pour tes explications Nemek.

    En fait concrètement, je cherche le moyen de parser avec les objets Java "standard" un document HTML simplement mais avec un minimum de performance.

    Tu indiques qu'utiliser un parser XML n'est pas la meilleur des solutions et je te l'accorde. Actuellement, j'utilise l'objet DocumentBuilder, mais la solution ne me satisfait pas...

Discussions similaires

  1. Inclure une div externe à ma page html
    Par Dynamès dans le forum jQuery
    Réponses: 27
    Dernier message: 07/06/2012, 14h50
  2. Réponses: 2
    Dernier message: 04/09/2010, 17h30
  3. [HTML]ouvrir une page html dans une div
    Par Phenomenium dans le forum Balisage (X)HTML et validation W3C
    Réponses: 5
    Dernier message: 16/01/2006, 17h23
  4. extraire une partie d'un document rtf
    Par yac dans le forum Oracle
    Réponses: 12
    Dernier message: 08/01/2006, 10h44
  5. exportation d'une valeur dans un document html
    Par acd dans le forum VB 6 et antérieur
    Réponses: 3
    Dernier message: 28/11/2005, 21h34

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo