IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

WinDev Discussion :

Parsing - Par quel bout commencer?


Sujet :

WinDev

  1. #1
    Membre éprouvé
    Inscrit en
    Avril 2008
    Messages
    1 129
    Détails du profil
    Informations forums :
    Inscription : Avril 2008
    Messages : 1 129
    Points : 1 283
    Points
    1 283
    Par défaut Parsing - Par quel bout commencer?
    Salut à tous !

    Je vous explique mon problème sur lequel je traine pour débuter

    Je récupère le code HTML d'une page web avec HTTPRequete() que je mets dans une variable sTexte ==> ok

    Je souhaiterai renseigner les bornes des éléments à récupérer dans 2 variables chaines sBorneGauche et sBorneDroite.

    PS : pourquoi après plusieurs heures en décidant d'exposer sur ce forum son souci, les idées arrivent subitement avant même d'avoir validé?

    Je poste quand même au cas ou !

    Est-ce une bonne idée de chercher dans sTexte le nombre d'occurences de sBorneDroite puis de faire des ExtraitChaine() en incrémentant le rang?

    Merci d'avance pour le temps que vous passez à nous aider

  2. #2
    Membre éprouvé Avatar de wimbish
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Octobre 2006
    Messages
    416
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2006
    Messages : 416
    Points : 1 073
    Points
    1 073
    Par défaut
    Bonjour,

    C'est souvent le cas, on trouve la réponse en énonçant le Pb.
    Ta solution semble pas mal même si tu ne parse pas vraiment ton code html.
    Christophe.

    Tous les chemins mènent à Rome http://doc.pcsoft.fr/fr-FR/

  3. #3
    Membre éprouvé
    Inscrit en
    Avril 2008
    Messages
    1 129
    Détails du profil
    Informations forums :
    Inscription : Avril 2008
    Messages : 1 129
    Points : 1 283
    Points
    1 283
    Par défaut
    Salut )

    Merci mais peux tu me guider vers la bonne voie avant je me m’empêtre dans un cambouis

  4. #4
    Membre éprouvé Avatar de wimbish
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Octobre 2006
    Messages
    416
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2006
    Messages : 416
    Points : 1 073
    Points
    1 073
    Par défaut
    Pas la peine de faire compliqué si ce n'est pas nécessaire.
    Si ton but est d'extraire le texte d'une balise dans du code html "simple" alors ta méthode est la bonne je pense, tu dois pouvoir le réaliser facilement avec un ExtraitChaine().
    Si tu veux analyser entièrement la structure DOM du html, il faudrait créer un parser html dans le style du parser XML existant (ce n'est peut être pas utile dans ton cas).
    Il y a des exemple en C#, des utilitaires etc ..
    D'autres l'on peut êtres déjà fait en Windev.
    Christophe.

    Tous les chemins mènent à Rome http://doc.pcsoft.fr/fr-FR/

  5. #5
    Membre émérite

    Profil pro
    Inscrit en
    Mars 2005
    Messages
    1 683
    Détails du profil
    Informations personnelles :
    Âge : 41
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Mars 2005
    Messages : 1 683
    Points : 2 579
    Points
    2 579
    Par défaut
    Bonjour,

    - HTML est du XML
    - Windev propose le type XMLDocument et les fonctions XMLxxx pour manipuler, parcourir, rechercher dans du XML ou mieux une requête XPath si vous connaissez déjà l'emplacement de ce que vous souhaitez extraire.

    Pour résumer HTTPRequete -> XMLDocument -> XMLExécuteXPath et ça devrait être bon.

  6. #6
    Membre éprouvé Avatar de wimbish
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Octobre 2006
    Messages
    416
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2006
    Messages : 416
    Points : 1 073
    Points
    1 073
    Par défaut
    Citation Envoyé par vmolines Voir le message
    Bonjour,
    - HTML est du XML
    Je ne suis pas complètement d'accord avec toi vmolines.
    Ce n'est pas du XML strict.
    Comment le parser XML se comporte avec les balise <br /> et les balises contenues dans les balises <Script> ?

    Si tu as raison, effectivement ta méthode est ultra simple.
    Christophe.

    Tous les chemins mènent à Rome http://doc.pcsoft.fr/fr-FR/

  7. #7
    Membre actif Avatar de peijnoob
    Profil pro
    Développeur informatique
    Inscrit en
    Août 2006
    Messages
    279
    Détails du profil
    Informations personnelles :
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Août 2006
    Messages : 279
    Points : 294
    Points
    294
    Par défaut
    Pour un peu plus de précision, HTML n'est pas du XML : par exemple, on trouve souvent des balises non fermées (telles que le <br>).

    XHTML par contre, est du XML strict, mais comme le dit wimbish, il y a de fortes chances de se retrouver avec des erreurs de parsing à cause des balises <script>, à moins que le code du site soit propre et que ce qui est à l'intérieur du <script> soit imbriqué dans un CDATA (obligatoire pour une validation XHTML strict au W3C il me semble).

  8. #8
    Membre émérite

    Profil pro
    Inscrit en
    Mars 2005
    Messages
    1 683
    Détails du profil
    Informations personnelles :
    Âge : 41
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Mars 2005
    Messages : 1 683
    Points : 2 579
    Points
    2 579
    Par défaut
    Vous avez raison j'aurais bien dû dire XHTML est du XML !

  9. #9
    Membre éprouvé
    Inscrit en
    Avril 2008
    Messages
    1 129
    Détails du profil
    Informations forums :
    Inscription : Avril 2008
    Messages : 1 129
    Points : 1 283
    Points
    1 283
    Par défaut
    Mon Dieu toutes ces réponses pour moi tout seul ! Je suis gaté

    Je me rends compte que j'ai tout faux depuis le début, effectivement j'ai plein de <br /> , </ , ... dans ma chaine.

    Je vais donc reprendre à zéro en partant sur du xmldocument!

    HA dur quand on y connait rien en web

    Merci les amis!

Discussions similaires

  1. par quel bout commencer avec la matrice?
    Par francis94000 dans le forum 4D
    Réponses: 3
    Dernier message: 27/10/2011, 11h51
  2. [Débuter] Par quel langage commencer ?
    Par fallais dans le forum Débuter
    Réponses: 23
    Dernier message: 29/08/2006, 09h49
  3. [Authentification] Que choisir? par quel bout commencer?
    Par clincks dans le forum Développement Web en Java
    Réponses: 4
    Dernier message: 19/06/2006, 00h04
  4. [langages] Par quels langages commencer ?
    Par denis_thierry62 dans le forum Général Conception Web
    Réponses: 5
    Dernier message: 20/12/2005, 19h16
  5. Réponses: 4
    Dernier message: 17/12/2005, 15h46

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo