IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Conception Web Discussion :

Parser html, quel langage ?


Sujet :

Conception Web

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Septembre 2007
    Messages
    34
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2007
    Messages : 34
    Points : 19
    Points
    19
    Par défaut Parser html, quel langage ?
    Bonjour,
    A l'aide ! Comme tout novice en dev web (langage habituel c++),
    je ne sais quel langage choisir et si c'est possible...
    J'ai fait un module en c++ qui execute des recherches sur plusieurs sites,
    et parse les pages de résultats pour les afficher...
    Maintenant il me faudrait une version multiplateforme...
    Est-il possible de le faire avec une techno web ? Laquelle ?
    Je précise qu'il serait bien que le parsing se fasse coté client pour ne pas surcharger le serveur (car de nombreuses requetes se feront).

    Merci de votre aide !

  2. #2
    Membre éclairé Avatar de haltabush
    Profil pro
    Développeur Web
    Inscrit en
    Avril 2005
    Messages
    726
    Détails du profil
    Informations personnelles :
    Âge : 38
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Avril 2005
    Messages : 726
    Points : 835
    Points
    835
    Par défaut
    Tu dois pouvoir faire ça en Javascript, je pense (XMLHTTPREQUEST (pas forcément asynchrone, c'est juste pour récupérer le code HTML de la page à parser) puis DOM pour le parsage proprement dit.
    Ceci dit, si tu as beaucoup de page à parser, ça va ramer je pense

  3. #3
    Membre à l'essai
    Profil pro
    Inscrit en
    Septembre 2007
    Messages
    34
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2007
    Messages : 34
    Points : 19
    Points
    19
    Par défaut
    Merci, je vais regarder ca,
    J'ai oublié un détail, le click sur un bouton:
    Une page html que je parse contient peut etre plusieurs pages...
    Peut-on avec ta methode simuler le click sur le bouton "page suivante" et récupérer la page suivante pour la parser aussi,etc... ?

    Merci d'avance...

  4. #4
    Membre éclairé Avatar de haltabush
    Profil pro
    Développeur Web
    Inscrit en
    Avril 2005
    Messages
    726
    Détails du profil
    Informations personnelles :
    Âge : 38
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Avril 2005
    Messages : 726
    Points : 835
    Points
    835
    Par défaut
    Sans doute oui, il faut que tu récupère les url et que tu y aille (balises a href, boutons submit, etc)... Par contre tu va te taper des boucles infinies du coup.

  5. #5
    Membre à l'essai
    Profil pro
    Inscrit en
    Septembre 2007
    Messages
    34
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2007
    Messages : 34
    Points : 19
    Points
    19
    Par défaut
    Thks, je demandais ca car,
    en regardant le code source de ces pages sur ces sites,
    certaines ont un lien html pour la page suivante de resultats,
    mais d'autres ont un lien du style "javascript:..."...
    Si ca marche je devrais pouvoir stopper en récuperant le nombre de pages...

  6. #6
    Membre éclairé Avatar de haltabush
    Profil pro
    Développeur Web
    Inscrit en
    Avril 2005
    Messages
    726
    Détails du profil
    Informations personnelles :
    Âge : 38
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Avril 2005
    Messages : 726
    Points : 835
    Points
    835
    Par défaut
    Arf, si tu veux interpréter le Javascript de la page, ça risque d'être compliqué...
    Moi ce que je ferais, c'est une recherche sur window.location, href, http, etc et je récupère l'url qu'il y a derrière. Il faudra aussi teste s'il y a des doublons avant d'aller analyser la page.

  7. #7
    Membre à l'essai
    Profil pro
    Inscrit en
    Septembre 2007
    Messages
    34
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2007
    Messages : 34
    Points : 19
    Points
    19
    Par défaut
    J'espere que le sessionID ne posera pas de probleme ?
    on peut faire des XMLHTTPREQUEST en conservant la session ouverte ?
    Dans mon module en c++, j'ouvre une session dans un browser virtuel, et simule les clicks...

  8. #8
    Membre éclairé Avatar de haltabush
    Profil pro
    Développeur Web
    Inscrit en
    Avril 2005
    Messages
    726
    Détails du profil
    Informations personnelles :
    Âge : 38
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Avril 2005
    Messages : 726
    Points : 835
    Points
    835
    Par défaut
    Ok, ben dans ce cas il vaut mieux rester en C++ je suppose...
    Javascript ne te simulera pas des clicks, enfin je crois pas que ce soit possible simplement.

Discussions similaires

  1. Réponses: 12
    Dernier message: 13/01/2010, 12h11
  2. Quel langage utilisez-vous : HTML, DHTML, XHTML ??
    Par siplusplus dans le forum Balisage (X)HTML et validation W3C
    Réponses: 9
    Dernier message: 07/05/2007, 21h25
  3. Réponses: 3
    Dernier message: 31/01/2007, 15h32
  4. Parser une page html, quel outil ?
    Par ggnore dans le forum Linux
    Réponses: 5
    Dernier message: 28/11/2006, 11h48
  5. [Parser HTML] quel parser utiliser pour du HTML 4.0 ?
    Par Cyber@l dans le forum API standards et tierces
    Réponses: 5
    Dernier message: 19/07/2004, 19h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo