|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Invité régulier
![]() Inscription : septembre 2007 Messages : 34 ![]() |
Bonjour,
A l'aide ! Comme tout novice en dev web (langage habituel c++), je ne sais quel langage choisir et si c'est possible... J'ai fait un module en c++ qui execute des recherches sur plusieurs sites, et parse les pages de résultats pour les afficher... Maintenant il me faudrait une version multiplateforme... Est-il possible de le faire avec une techno web ? Laquelle ? Je précise qu'il serait bien que le parsing se fasse coté client pour ne pas surcharger le serveur (car de nombreuses requetes se feront). Merci de votre aide ! |
|
|
00
|
|
|
#2 |
|
Membre chevronné
![]() Développeur Web Inscription : avril 2005 Messages : 726 ![]() |
Tu dois pouvoir faire ça en Javascript, je pense (XMLHTTPREQUEST (pas forcément asynchrone, c'est juste pour récupérer le code HTML de la page à parser) puis DOM pour le parsage proprement dit.
Ceci dit, si tu as beaucoup de page à parser, ça va ramer je pense
__________________
HADOPI : black-out du net! |
|
|
00
|
|
|
#3 |
|
Invité régulier
![]() Inscription : septembre 2007 Messages : 34 ![]() |
Merci, je vais regarder ca,
J'ai oublié un détail, le click sur un bouton: Une page html que je parse contient peut etre plusieurs pages... Peut-on avec ta methode simuler le click sur le bouton "page suivante" et récupérer la page suivante pour la parser aussi,etc... ? Merci d'avance... |
|
|
00
|
|
|
#4 |
|
Membre chevronné
![]() Développeur Web Inscription : avril 2005 Messages : 726 ![]() |
Sans doute oui, il faut que tu récupère les url et que tu y aille (balises a href, boutons submit, etc)... Par contre tu va te taper des boucles infinies du coup.
__________________
HADOPI : black-out du net! |
|
|
00
|
|
|
#5 |
|
Invité régulier
![]() Inscription : septembre 2007 Messages : 34 ![]() |
Thks, je demandais ca car,
en regardant le code source de ces pages sur ces sites, certaines ont un lien html pour la page suivante de resultats, mais d'autres ont un lien du style "javascript:..."... Si ca marche je devrais pouvoir stopper en récuperant le nombre de pages... |
|
|
00
|
|
|
#6 |
|
Membre chevronné
![]() Développeur Web Inscription : avril 2005 Messages : 726 ![]() |
Arf, si tu veux interpréter le Javascript de la page, ça risque d'être compliqué...
Moi ce que je ferais, c'est une recherche sur window.location, href, http, etc et je récupère l'url qu'il y a derrière. Il faudra aussi teste s'il y a des doublons avant d'aller analyser la page.
__________________
HADOPI : black-out du net! |
|
|
00
|
|
|
#7 |
|
Invité régulier
![]() Inscription : septembre 2007 Messages : 34 ![]() |
J'espere que le sessionID ne posera pas de probleme ?
on peut faire des XMLHTTPREQUEST en conservant la session ouverte ? Dans mon module en c++, j'ouvre une session dans un browser virtuel, et simule les clicks... |
|
|
00
|
|
|
#8 |
|
Membre chevronné
![]() Développeur Web Inscription : avril 2005 Messages : 726 ![]() |
Ok, ben dans ce cas il vaut mieux rester en C++ je suppose...
Javascript ne te simulera pas des clicks, enfin je crois pas que ce soit possible simplement.
__________________
HADOPI : black-out du net! |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com