IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

PHP & Base de données Discussion :

Créer un robot qui récupère des documents sur le web


Sujet :

PHP & Base de données

  1. #1
    Nouveau Candidat au Club
    Femme Profil pro
    Inscrit en
    Novembre 2012
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations forums :
    Inscription : Novembre 2012
    Messages : 1
    Points : 1
    Points
    1
    Par défaut Créer un robot qui récupère des documents sur le web
    Bonjour à tous,

    Tout d'abord j'espère poster au bon endroit.

    Alors, je souhaiterai un petit robot qui puisse aller sur des sites donnés(dont les adresses seront enregistrées dans ma base de données). Ce robot lira les codes sources HTML afin de récupérer des documents en format pdf ou bien bien les liens vers ces documents la et les enregistrer dans la table qui leur est dédiés. Parfois, pour accéder à ces documents je devrai remplir un petit formulaire afin de renseigner la date ou le pays par exemple. Ce qui me pose un peu problème.

    Ce projet est en cours d'élaboration mais c'est vrai je suis un peu perdu et j'aimerai avoir des pistes pour le mener à bien.

    Toutes vos idées sont les bienvenues. Merci.

  2. #2
    Membre éprouvé Avatar de redoran
    Homme Profil pro
    Développeur-Amateur
    Inscrit en
    Juin 2010
    Messages
    1 346
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : Algérie

    Informations professionnelles :
    Activité : Développeur-Amateur
    Secteur : Santé

    Informations forums :
    Inscription : Juin 2010
    Messages : 1 346
    Points : 1 031
    Points
    1 031
    Par défaut
    salut; la plus part des robots web obéit a certaines règles écrites sur un fichier text (robots.txt) et enregistrés dans votre site. ils ont des rôles différents , mais celui de récupéré des documents PDF !!!! je ne connais pas sauf erreur de ma part.

  3. #3
    Modérateur
    Avatar de grunk
    Homme Profil pro
    Lead dév - Architecte
    Inscrit en
    Août 2003
    Messages
    6 691
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : Lead dév - Architecte
    Secteur : Industrie

    Informations forums :
    Inscription : Août 2003
    Messages : 6 691
    Points : 20 222
    Points
    20 222
    Par défaut
    C'est tout à fait possible.

    Pour la partie concernant les formulaire à remplir, il suffit de regarder la cible du formulaire (l'attribut action) et que ton robot envoi une requête à cette adresse.

    L'envoi de cette requête peut simplement se faire via un file_get_contents associé à un stream.

    Par exemple (non testé) :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    $postdata = http_build_query(array('pays'=>'fr','date'=>'2012-11-13'));
     
    $opts = array('http' =>
        array(
            'method'  => 'POST',
            'header'  => 'Content-type: application/x-www-form-urlencoded',
            'content' => $postdata
        )
    );
     
    $context  = stream_context_create($opts);
    $file = 'myfile.pdf';
    file_put_contents($file,file_get_contents('http://siteavecpdf.com/actionformulaire.php', false, $context));
    Ou alors pour des choses plus poussée tu peux également utiliser CURL

    un exemple pour télécharger un fichier avec curl
    Pry Framework php5 | N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  4. #4
    Membre éprouvé Avatar de redoran
    Homme Profil pro
    Développeur-Amateur
    Inscrit en
    Juin 2010
    Messages
    1 346
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : Algérie

    Informations professionnelles :
    Activité : Développeur-Amateur
    Secteur : Santé

    Informations forums :
    Inscription : Juin 2010
    Messages : 1 346
    Points : 1 031
    Points
    1 031
    Par défaut
    Re ; et si le robots trouve le fichier robots.txt dans la racine du site est ce que il va lire le formulaire ?

  5. #5
    Modérateur
    Avatar de grunk
    Homme Profil pro
    Lead dév - Architecte
    Inscrit en
    Août 2003
    Messages
    6 691
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : Lead dév - Architecte
    Secteur : Industrie

    Informations forums :
    Inscription : Août 2003
    Messages : 6 691
    Points : 20 222
    Points
    20 222
    Par défaut
    Citation Envoyé par redoran Voir le message
    Re ; et si le robots trouve le fichier robots.txt dans la racine du site est ce que il va lire le formulaire ?
    robots.txt n'a aucune incidence , c'est au développeur de faire en sorte que son robots l'interprète. A part les moteurs de recherche personne ne respecte ce fichier
    Pry Framework php5 | N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  6. #6
    Membre éprouvé Avatar de redoran
    Homme Profil pro
    Développeur-Amateur
    Inscrit en
    Juin 2010
    Messages
    1 346
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : Algérie

    Informations professionnelles :
    Activité : Développeur-Amateur
    Secteur : Santé

    Informations forums :
    Inscription : Juin 2010
    Messages : 1 346
    Points : 1 031
    Points
    1 031
    Par défaut
    merci grunk , donc en aucun cas ne sera une barrière de sécurité.
    j'aimerai bien avoir une idée sur l’implémentation de ce type robots

Discussions similaires

  1. Réponses: 1
    Dernier message: 29/06/2011, 14h27
  2. Ecrire un robot qui remplirai des formulaires web et les validerai
    Par biglittlekiss dans le forum Général Java
    Réponses: 22
    Dernier message: 11/02/2007, 17h44
  3. Développer un robot qui remplit des formulaires
    Par rebaj83 dans le forum Langage
    Réponses: 9
    Dernier message: 18/12/2006, 13h41
  4. [MySQL] Créer une fonction qui récupère un enregistrement
    Par azahord dans le forum PHP & Base de données
    Réponses: 8
    Dernier message: 10/11/2006, 20h13
  5. Réponses: 2
    Dernier message: 31/05/2006, 09h58

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo