IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

XML/XSL et SOAP Discussion :

Analyse de code HTML et simplification par l'XML


Sujet :

XML/XSL et SOAP

  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Août 2004
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2004
    Messages : 15
    Points : 6
    Points
    6
    Par défaut Analyse de code HTML et simplification par l'XML
    Bonjour,

    J'ai une page HTML bien complexe récupérée sur le web automatiquement et je dois recuperer des infos dedans...
    Seul soucis, le format de la page change subreptissement souvent pour eviter les repompes, genre des tags d'un TD mis dans un ordre different etc etc...

    Je me demandais si plutot que de découper de la chaine de caratere brut il ne serait pas mieux d'appliquer une feuille XSL pour virer les tags inutiles <script></script>, et garder le plus important <TD> et autre <B> qui me donnent eux de vrais infos sur ou se trouvent mes infos.. en plsu apres si le format change je ne refais que la page XSL.

    Qu'en pensez-vous ? avez vous des bous de codes XSL en exemple ? je ne sais même pas par quoi commencer vu que je suis pas un pro en XML....

    merci !

  2. #2
    Rédacteur

    Avatar de Erwy
    Homme Profil pro
    Développeur Web
    Inscrit en
    Novembre 2003
    Messages
    4 967
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Web
    Secteur : Administration - Collectivité locale

    Informations forums :
    Inscription : Novembre 2003
    Messages : 4 967
    Points : 10 927
    Points
    10 927
    Par défaut
    Peut être possible a condition deja qu'il n'y est pas de signe < dans les balises script et que cela respecte un format xml, pas de bailse <br> ou <p> non ferme par exemple

  3. #3
    Expert éminent
    Avatar de GrandFather
    Inscrit en
    Mai 2004
    Messages
    4 587
    Détails du profil
    Informations personnelles :
    Âge : 54

    Informations forums :
    Inscription : Mai 2004
    Messages : 4 587
    Points : 7 103
    Points
    7 103
    Par défaut
    Bonjour,

    si ta page récupérée n'est pas au format XHTML "strict", il y a peu de chances qu'elle soit bien formée au sens XML du terme et donc exploitable directement par un processeur XSLT. Tu vas donc devoir passer par un pré-traitement pour la rendre conforme au standard XML, avant de récupérer les informations. L'outil idéal pour ce type de traitement est Tidy.
    FAQ XML
    ------------
    « Le moyen le plus sûr de cacher aux autres les limites de son savoir est de ne jamais les dépasser »
    Giacomo Leopardi

  4. #4
    Futur Membre du Club
    Profil pro
    Inscrit en
    Août 2004
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2004
    Messages : 15
    Points : 6
    Points
    6
    Par défaut Nettoyage o u complétude ?
    plutot que de completer le code je pensais le nettoyer, en virant les balises inutiles surtout....
    je vais voir Tidy quand meme c'ets toujours bon à connaitre ca.

    Après épuration, mon code est conforme toute balise ouverte est fermée...

Discussions similaires

  1. Analyser du code html
    Par php-beginner dans le forum Langage
    Réponses: 3
    Dernier message: 03/09/2009, 21h36
  2. [RegEx] Analyse de code HTML d'une liste déroulante
    Par sigmoun dans le forum Langage
    Réponses: 7
    Dernier message: 19/08/2009, 13h57
  3. [RegEx] Analyser du code html
    Par Invité dans le forum Langage
    Réponses: 1
    Dernier message: 05/08/2009, 20h38
  4. [MySQL] Analyse de code HTML
    Par safari25 dans le forum PHP & Base de données
    Réponses: 4
    Dernier message: 12/06/2009, 17h06
  5. Analyse de code HTML en réponse a une requête post.
    Par ghost942 dans le forum Composants VCL
    Réponses: 2
    Dernier message: 04/06/2005, 21h40

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo