IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

un crawler en php


Sujet :

Langage PHP

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé Avatar de kodokan
    Profil pro
    Lycéen
    Inscrit en
    Avril 2006
    Messages
    127
    Détails du profil
    Informations personnelles :
    Âge : 33
    Localisation : France

    Informations professionnelles :
    Activité : Lycéen

    Informations forums :
    Inscription : Avril 2006
    Messages : 127
    Par défaut un crawler en php
    Bonjour tout le monde

    J'ai fait des recherches ici et sur google et je n'ai pas trop trouvé ce que je cherchais . Je vous explique ce que je voudrais faire : j'aimerais developper un crawler en php . Est-ce possible ? Je sais que je peux le faire en JAVA mais je n'utiliserais cette option qu'en dernier recours (N'y connaissant pas grand chose )Auriez-vous un tuto à me proposer pour ce crawler en php ? merci

    Pour ceux qui seraient intéréssé, je vous donne le lien vers ll'excellent programme de fildz : http://fildz.dyndns.org/Sites/Fildz/viewProject.php?p=4

    Merci pour vos réponses

  2. #2
    Membre émérite

    Profil pro
    Inscrit en
    Mai 2005
    Messages
    657
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2005
    Messages : 657
    Par défaut
    Salut,

    Pour un crawler, les principales opérations à effectuer sont :
    - Récuperer une page web via HTTP
    - Analyser son contenu (entre autre trouver des liens hypertexte dedans)
    - Interfacer avec une base de données

    Donc je dirais que c'est tout à fait fesable en PHP. Qu'est-ce qui te pose problème exactement ?

    Evidement ton script ne tournera surement pas derrière un serveur HTTP, mais plutot via une interface en ligne de commande (CLI). Si c'est là que tu as un souci, cherche sur google avec "ligne de commande" ou "CLI" en mots clés et tu devrais trouver ce que tu cherches.

  3. #3
    Membre confirmé Avatar de kodokan
    Profil pro
    Lycéen
    Inscrit en
    Avril 2006
    Messages
    127
    Détails du profil
    Informations personnelles :
    Âge : 33
    Localisation : France

    Informations professionnelles :
    Activité : Lycéen

    Informations forums :
    Inscription : Avril 2006
    Messages : 127
    Par défaut
    Salut Taum ,

    Merci de ta réponse .Là où je coince en fait c'est au moment de récupérer le lien .
    Je pense que je devrais faire un truc du style :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
     
    //on récupere $page grace à un fopen()
     
    $page = "code html de la page";
         if(ereg("<a href=",$page))
         {
         // la je coince : quelle fonction utiliser ???
         }
    else
    {
    etc ...
    }
    Sinon pourquoi mon script ne pourrait - il pas marché sous http ?

  4. #4
    Membre confirmé Avatar de kodokan
    Profil pro
    Lycéen
    Inscrit en
    Avril 2006
    Messages
    127
    Détails du profil
    Informations personnelles :
    Âge : 33
    Localisation : France

    Informations professionnelles :
    Activité : Lycéen

    Informations forums :
    Inscription : Avril 2006
    Messages : 127
    Par défaut
    Bon j'ai trouvé ça : http://g-rossolini.developpez.com/tu...ge=page_1#LI-C

    ainsi que ce topic : http://www.developpez.net/forums/sho...hlight=crawler

    je vais regarder ça de plus prés

Discussions similaires

  1. Crawler un site entier en PHP
    Par diaz987 dans le forum Langage
    Réponses: 3
    Dernier message: 26/05/2015, 10h32
  2. crawler en php/curl
    Par johnny-57 dans le forum Langage
    Réponses: 8
    Dernier message: 29/09/2013, 16h45
  3. Quel est le meilleur script PHP de portail (CMS) ?
    Par Lana.Bauer dans le forum EDI, CMS, Outils, Scripts et API
    Réponses: 187
    Dernier message: 18/10/2012, 08h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo