|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Invité de passage
![]() Inscription : mai 2011 Messages : 3 ![]() |
Bonjour,
N'ayant pas trouvé de section générale je post ici à défaut d'ailleurs. En fait j'ai des bases en programmation mais seulement des bases. J'aimerais faire un bot analyseur de pages. C'est à dire un peu à la manière des bot de moteurs de recherches qui parcourent les pages en utilisant les liens et qui finissent par référencer les sites entiers. Moi ce que j'aimerais faire est similaire un bon qui par exemple parcourerait toutes les pages de developpez.com à la recherche du mot "Salutations" et qui renverraient l'adresse correspondante. Je voulais savoir si des gens ayant un certain recule sur la programmation pouvaient m'aiguiller : -Quel language serait le mieux adapté pour faire ca, php, perl voire c ou c++ ? -Par ou commencer, j'ai les bases de programmation mais je ne sais pas du tout comment faire pour dire à un programme de télécharger le code html d'une page. Si déjà je savais faire ca je pense que je pourrais me débrouiller. Voilà merci ! |
|
|
00
|
|
|
#2 |
![]() ![]() Benjamin DelespierreDéveloppeur Web Inscription : février 2010 Messages : 2 984 ![]() |
Hello
Ce que tu cherches a faire existe déjà et ça s'appelle un spider. En voici un par exemple écrit en php: http://www.sphider.eu/ Pour ce qui est de récupérer des flux HTML tu peux regarder du coté de DOMDocument.
__________________
A la recherche d'un framework MVC facile a prendre en main ? Essayez Axiom Nouveau: la référence d'Axiom est disponible sur GitHub (je la peaufine en ce moment même). Un problème correctement identifié est à moitié résolu, évitez de poster l'intégralité de votre code avec pour seule explication "ça ne marche pas...". Pour identifier correctement vos problèmes PHP, utilisez la gestion des erreurs et xdebug. Les boutons et existent, servez-vous en
|
|
00
|
|
|
#3 | ||
|
Expert Confirmé
![]() Inscription : mars 2005 Messages : 2 823 ![]() |
Citation:
Citation:
Code :
$page = file_get_contents('h**p://www.unsite.com/unepage.html') ;
__________________
Un problème exposé clairement est déjà à moitié résolu Keep It Smart and Simple |
||
|
|
00
|
Copyright © 2000-2012 - www.developpez.com