|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | |
![]() ![]() ![]() ![]() Thomas LevesqueDéveloppeur .NET Inscription : février 2004 Messages : 17 793 ![]() |
Bonjour,
Extraction de données de pages web à l'aide de HTML Agility Pack Citation:
N'hésitez pas à noter et commenter l'article dans cette discussion
__________________
Pas de questions techniques par MP ! Le forum est là pour ça... |
|
|
30
|
|
|
#2 |
|
Membre éprouvé
![]() ![]() Développeur .NET Inscription : août 2004 Messages : 123 ![]() |
Salut,
C'est excellent je ne connaissais pas du tout cette bibliothèque ! J'en comprends tout l'intérêt car pour un projet perso, j'ai été amené à faire ce genre de traitement. Et je suis tombé dans le cas numéro 1 C'est beaucoup plus souple de cette façon ! |
|
|
00
|
|
|
#3 |
|
Membre habitué
![]() Abdelilah amezghalDéveloppeur informatique Inscription : février 2006 Messages : 74 ![]() |
En php j'utilise phpQuery.
je teste le code jQuery dans la console js et je le copie tout simplement. |
|
|
00
|
|
|
#4 |
|
Membre chevronné
![]() Etienne MermillodInscription : février 2007 Messages : 442 ![]() |
Salut,
Très bon article, mais je pense qu'il aurait été utile de mentionner fizzler qui est une surcouche de AgilityPAck et permet d'utiliser des sélecteurs css au lieu de xsl: http://code.google.com/p/fizzler/ |
|
|
00
|
|
|
#5 | |
![]() ![]() ![]() ![]() Thomas LevesqueDéveloppeur .NET Inscription : février 2004 Messages : 17 793 ![]() |
Citation:
Je ne l'ai pas mentionné tout simplement parce que je ne connaissais pas... effectivement ça a l'air sympa ! Par contre c'est encore en beta...
__________________
Pas de questions techniques par MP ! Le forum est là pour ça... |
|
|
00
|
|
|
#6 |
|
Membre régulier
![]() Henri PoincareArchitecte technique Inscription : mai 2007 Messages : 43 ![]() |
Le framework client Ada Web server (AWS) permet le web scraping très facilement :
exemple http://rosettacode.org/wiki/Web_scraping#Ada |
|
|
00
|
|
|
#7 | |
![]() ![]() ![]() ![]() Thomas LevesqueDéveloppeur .NET Inscription : février 2004 Messages : 17 793 ![]() |
Citation:
__________________
Pas de questions techniques par MP ! Le forum est là pour ça... |
|
|
00
|
|
|
#8 |
|
Invité de passage
![]() Inscription : mai 2012 Messages : 7 ![]() |
Bonjour,
Merci pour ce tutoriel, sympas et efficace. L'article stipule à la fin qu'il est possible de modifier des pages html, a tout hasard serait-il également possible de ce s'identifier sur un site web via cette librairie ? |
|
|
00
|
|
|
#9 | |
![]() ![]() ![]() ![]() Thomas LevesqueDéveloppeur .NET Inscription : février 2004 Messages : 17 793 ![]() |
Citation:
Si c'est basé sur un formulaire et des cookies, ce sera peut-être un peu plus complexe. Il faudra d'abord poster le user/password pour s'identifier avec HttpWebRequest et récupérer les cookies, puis renvoyer les cookies à chaque requête. A priori ce n'est pas faisable directement avec la classe HtmlWeb, mais rien n'empêche de faire les requêtes avec HttpWebRequest et de parser le résultat avec Html Agility Pack. Il suffit d'utiliser la méthode Load qui prend un Stream en paramètre dans la classe HtmlDocument.
__________________
Pas de questions techniques par MP ! Le forum est là pour ça... |
|
|
00
|
Copyright © 2000-2013 - www.developpez.com