-
Perl et le LWP
Bonjour tout le monde
Dans une page, j'ai une rubrique actualités pour laquelle je suis sensé ramener les informations d'un site internet via LWP, alors je raméne le code HTML de la page, je le traite puis en extraite les grands titres puis je les stocke dans un fichier txt
Le probème c'est que je trouve que cette méthode n'est pas très sûre, vu que la structure de la page risque de changer.
Connaissez-vous une méthode pour le faire qui soit plus simple et plus utile ?
j'ai entendu parler des serveurs d'actualités pour .NET, y'a pas une chose d'équivalent en perl ??
Merci
-
Salut
Cette page est-elle du HTML pure ou est-ce un flux XML ? Car dans le cas du XML, cela serait plus simple de faire un lecteur de flux RSS.
@++
-
En fait ce que je veux c'est avoir l'actualité française, ce que j'essaie de faire maintenant c'est la prendre du site lemonde.fr dont la page est entierement HTML, je sais pas s'il y a qqch qui offre ce service en XML ??
-
A ce lien http://www.lemonde.fr/rss/sequence/0,2-3208,1-0,0.xml , j'ai pû récupérer la une du monde du jour au format XML. A toi ensuite de le parser avec par exemple le génialissime XPath pour récupérer l'info qui t'intéresse.
@++
-
je croi que cette page ne contient pas les dernières infos, mais ça peut faire l'affaire
Merci beaucoup
-
En effet, c'est la une du jour. Cependant, en fouillant sur le site lemonde.fr, tu devrais trouver un flux RSS mis à jour.
@++