IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Robot référenceur


Sujet :

Langage PHP

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Profil pro
    Inscrit en
    Février 2007
    Messages
    280
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2007
    Messages : 280
    Par défaut Robot référenceur
    bonjours
    je mexcuse déjà si je l'ai poste dans la mauvaise catégorie
    j'aimerais savoir comment prendre l'url d'un site et enregistre tout les url qui a sur se site et l'envoyer dans ma base de données ( pour remplir mon moteur de recherche ).
    Après si cela est toujours possible :s prendre un site au hasard dans la table ( avec rand c'est possible je pense ) et faire ce qui est décrit si dessus.
    je ne veut pas de code tout fait mais plutôt des tutos ou des morceaux de code .

    ps: ci c'est possible j'aimerai plutôt le faire ne php.

    merci de me répondre schats

  2. #2
    Membre averti
    Profil pro
    Inscrit en
    Juin 2006
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2006
    Messages : 17
    Par défaut
    ca s'appelle un crawler

  3. #3
    Membre Expert

    Profil pro
    Inscrit en
    Octobre 2002
    Messages
    1 138
    Détails du profil
    Informations personnelles :
    Âge : 45
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Octobre 2002
    Messages : 1 138
    Par défaut
    Ce genre de projets est faisable mais devient délicat selon tes objectifs. Car crawler le web n'est pas une mince affaire !

    Une idée serait de prendre une page d'un site (avec foskopen par exemple), de la parcourir pour rechercher tous les liens "<a></a>" et d'en extraire la cible à l'aide d'une expression régulière.
    Chaque nouveau lien sera enregistré en bdd en lien interne ou lien externe selon le cas si tu ne l'as pas déjà trouvé / enregistré (pour éviter les doublons).

    Ensuite tu prends un lien externe au hasard trouvé dans ta base de données ainsi crée et tu réeffectues la meme opération.

    Tu as un outil relativmenet accéssible qui s'appelle sphider dont tu peux regarder la source (pas trop grosse) et t'en inspirer.

  4. #4
    Membre expérimenté Avatar de Mogwaï
    Inscrit en
    Mai 2004
    Messages
    247
    Détails du profil
    Informations personnelles :
    Âge : 45

    Informations forums :
    Inscription : Mai 2004
    Messages : 247
    Par défaut
    Il existe aussi l'excellent utilitaire linux wget, qui peut être appelé depuis un script PHP et qui dispose d'options de crawl assez avancées.

  5. #5
    Membre éclairé
    Profil pro
    Inscrit en
    Février 2007
    Messages
    280
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2007
    Messages : 280
    Par défaut
    Citation Envoyé par Mogwaï Voir le message
    Il existe aussi l'excellent utilitaire linux wget, qui peut être appelé depuis un script PHP et qui dispose d'options de crawl assez avancées.
    euh je n'ai pas linux ...bon je ne peu pas le faire :s
    Tu as un outil relativmenet accéssible qui s'appelle sphider dont tu peux regarder la source (pas trop grosse) et t'en inspirer.
    je vais regarder pour la fonction .
    euh sa ne serait pas spider .... enfin je vais aussi regarder .

    merci de votre réponse

  6. #6
    Membre éclairé
    Profil pro
    Inscrit en
    Février 2007
    Messages
    280
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2007
    Messages : 280
    Par défaut
    bonjours jai regarder la fonction foskopen
    mais il faut maitriser les stoket et il me semble qu'il ne génère pas les url peu être avec une fonction du style preg_replace ( je sais que c'est pas celle la :p)
    par contre le spider je n'arrive pas a trouver un exemple :d

Discussions similaires

  1. [Strategie] Emulation clavier, Class Robot
    Par Invité dans le forum AWT/Swing
    Réponses: 5
    Dernier message: 06/07/2005, 13h37
  2. Réponses: 24
    Dernier message: 17/03/2005, 01h36
  3. [GD] Code graphique anti robot
    Par miel_pops dans le forum Bibliothèques et frameworks
    Réponses: 17
    Dernier message: 03/03/2005, 01h03
  4. Réponses: 6
    Dernier message: 24/01/2005, 15h12
  5. les robots et les scripts
    Par khayyam90 dans le forum Balisage (X)HTML et validation W3C
    Réponses: 3
    Dernier message: 26/10/2004, 14h12

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo