Précédent   Forum des professionnels en informatique > PHP > Langage > Débuter
Débuter Forum d'entraide pour débuter en PHP. Avant de poster -> Cours PHP, FAQ PHP, Outils PHP, etc.
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 30/09/2011, 21h38   #1
 
Homme Jean-Eustache de la Rochebrochart
Consultant E-Business
Inscription : mai 2011
Messages : 17
Détails du profil
Informations personnelles :
Nom : Homme Jean-Eustache de la Rochebrochart
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Consultant E-Business
Secteur : Conseil

Informations forums :
Inscription : mai 2011
Messages : 17
Points : -1
Points : -1
Par défaut Récupérer données pages web via PHP

Bonjour,

Je souhaiterai manipuler le contenu de plusieurs pages web de façon automatisée.

Voici le lien d'un exemple :

http://www.livejournal.com/misc/expunged_list.bml

Comme vous le voyez, il y a des mots en colonne contenus dans des tableaux.

Le premier mot est donc : a000034857731

Je souhaiterai :

1. Récupérer le contenu de ces mots dans un fichier (soit jusqu'au mot "a1teraj") et qu'ils soient bien tous à la ligne les uns en dessous des autres, sans balises <li></li>, seulement les mots.
2. Appuyer sur "filter" (ce qui a pour effet de réactualiser la page avec de nouveaux mots), les mettre à la suite des premiers, et donc faire une boucle (sur la lettre "A" donc) jusqu'à ce que le contenu soit identique à un contenu déjà répertorié dans le fichier de récupération.
3. Passer à la lettre "B", appuyez sur "filter".
4. Répéter l'opération jusqu'au dernier mots issus du "filter" non répertorié dans le fichier de la lettre Z.

Avez vous une idée ?

Cordialement,

Jean.
je.rochebrochart est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/10/2011, 11h00   #2
Membre éclairé
 
Avatar de firehist
 
Homme Benjamin Longearet
Intégrateur Web Freelance
Inscription : février 2008
Messages : 153
Détails du profil
Informations personnelles :
Nom : Homme Benjamin Longearet
Âge : 24
Localisation : France

Informations professionnelles :
Activité : Intégrateur Web Freelance
Secteur : High Tech - Éditeur de logiciels

Informations forums :
Inscription : février 2008
Messages : 153
Points : 357
Points : 357
Envoyer un message via Skype™ à firehist
Bonjour,

Quelques pistes:
  • Tu dois utiliser cURL pour récupérer le contenu.
  • Regarde les variables POST envoyer à la page pour effectuer les actions de clic sur les boutons
  • Tu doit récupérer ta liste une fois le contenu HTML récupéré (il existe des parser HTML en PHP assez puissant et facile d'utilisation)

Bon dév'
__________________
Ingénieur Web Freelance - Firehist Studio
Profil Viadeo Benjamin Longearet
Geekos.fr : Blog technique sur les technologies du Web
---
Citation:
De l'innovation nait la solution et inversement
firehist est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 03h47.


 
 
 
 
Partenaires

Hébergement Web