voila, j'ai un robot de type mechanize qui doit me recuperer une page pleine de javascript. Pour le html j'utilise HTML TagReader, mais quel parser utiliser pour lire le javascript recuperé?
voila, j'ai un robot de type mechanize qui doit me recuperer une page pleine de javascript. Pour le html j'utilise HTML TagReader, mais quel parser utiliser pour lire le javascript recuperé?
comme je voi qu'il y a pas de reponses je vais détailler:
je recupere une page web avec mon robot, que j'enregistre.
après je voudrai simplement lire le code qu'elle contient, pour le html ca va, mais pour le javascript pas du tout car mon parser HTML::TagReader ne veut pas traiter le javascript?
une idée?
je peu pas croire que personne n'a jamais fait ca; si vous aviez même juste une piste je suis prenneur.
merci
tu peux recuperer avec le module html:parser non? en specifiant comme nom de balise script!!!
Sinon une regex, mais si c'est pas tres propre dans le cas de html.
voilà, ça peut te guider.
Courage
- Les meilleurs cours et tutoriels Perl et Perl 6 pour vous former ;
- FAQ Perl, Perl 6 et Perl/Tk d'entraide ;
- Les news sur la rubrique Perl ;
- S'abonner au compte Twitter de la rubrique Perl ;
- Mes tutoriels developpez.com.
Pas de questions technique par messagerie privée (lisez les règles du forum Perl) et pour les nouveaux !
"sinon une regex"
tu veux dire koi par là? c'est pas grave pour le HTMl, ce qui m'interesse c'est le javascript.
tu sais pas à l'avance comment est fait le html, donc le parser avec une regex peu etre difficile. mais bon, essaye qd même
- Les meilleurs cours et tutoriels Perl et Perl 6 pour vous former ;
- FAQ Perl, Perl 6 et Perl/Tk d'entraide ;
- Les news sur la rubrique Perl ;
- S'abonner au compte Twitter de la rubrique Perl ;
- Mes tutoriels developpez.com.
Pas de questions technique par messagerie privée (lisez les règles du forum Perl) et pour les nouveaux !
auriez-vous un exemple? une page où quelqu'un aurai fait ca? car là je voi pas du tout comment me servir du"regex"...
autre solution je recupere ma page html, puis je stock chaque ligne dans un tableau, et là j'obtiens pour chaque ligne:
restes plus qu'à récupérer chaque valeur avec des expressions regulières, sachant que je veu recuperer la 1ère valeure,la 2ème, la5ème et la 6ème (chaque valeure est séparée par une virgule), quelle expression regulière utiliser?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 new SI(0x3035a13z,4242,"Server 2","www.mon-site.de",462602,87708502,0x9847ea6,0xfffc107e,0),
merci d'avance.
Partager