Interpréter le JavaScript
Bonjour,
J'ai besoin de développer un webcrawler qui soit capable d'interpréter le javascript. L'idée étant de faire de la veille concurrentielle, je suis souvent bloqué avec php/curl sur des sites comme ebay qui n'autorise pas l'utilisation du moteur de recherche si JS est désactivé ou d'autre qui affiche les prix après appel javascript. J'ai trouvé phantomjs, mais je ne suis pas certain que ça réponde à mon besoin. Des idées/pistes ?
Merci d'avance.
APIs non officielles et bidouiller avec son navigateur
Pas d'API officielle ? Peut-être qu'il en existe une alternative et même plusieurs. D'ailleurs d'un certain point de vue tu cherches à développer une solution similaire même si plus modeste. Faut comprendre qu'on est pas les seuls à hacker joyeusement des sites pour extraire des données et plus si affinités !
Sinon pour des pistes je pense à Greasemonkey, même si c'est pour personnaliser le fonctionnement d'un site ça très ludique et donc idéal pour découvrir ce monde merveilleux, et surtout des ressources comme le Mozilla Developer Network. Les possibilités sont infinies : Extension (JavaScript & Cie), greffon en C/C++, accès à des bases de données… L'avantage c'est de disposer de la puissance du moteur d'un navigateur. Par exemple la fonctionnalité d'archivage d'une page une fois tout son contenu chargée et exécutée donc miam miam (X)HTML, CSS, JavaScript…
Après je peux pas t'aider plus précisément car je suis un petit joueur ! Mais j'ai été suffisamment curieux pour faire quelques découvertes intéressantes.