IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Réseau/Web Python Discussion :

aspirateur site web python3 (python2 initialement)


Sujet :

Réseau/Web Python

  1. #21
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 283
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 283
    Points : 36 770
    Points
    36 770
    Par défaut
    Citation Envoyé par marco056 Voir le message
    Je reviens sur ce programme car je souhaiterais faire la même chose mais en explorant les sous-répertoires. Je cherche désespérément une solution depuis 2 heures...
    "en explorant les sous-répertoires" d'un site web?
    C'est "complique" car le serveur web répond un peu comme il veut aux requêtes HTTP. C'est ce qui rend les crawlers difficiles a construire: chaque site pouvant demander des règles spécifiques.
    Sans codage spécifique, vous arriverez difficilement a faire mieux que wget.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  2. #22
    Expert éminent
    Avatar de tyrtamos
    Homme Profil pro
    Retraité
    Inscrit en
    Décembre 2007
    Messages
    4 461
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Retraité

    Informations forums :
    Inscription : Décembre 2007
    Messages : 4 461
    Points : 9 248
    Points
    9 248
    Billets dans le blog
    6
    Par défaut
    Bonjour,

    Tiens, j'ai toujours pensé qu'on ne pouvait pas parcourir les sous-répertoires du serveur en http. Pour atteindre un fichier situé dans un sous-répertoire, il faut que son adresse ait été citée dans l'une des pages web déjà examinée du site. Et cette limitation n'empêche absolument pas le bon fonctionnement des aspirateurs de site web.

    Par contre, le parcours récursif des sous-répertoires est possible avec FTP (avec les droits qu'il faut), et heureusement pour la gestion des sites!
    Un expert est une personne qui a fait toutes les erreurs qui peuvent être faites, dans un domaine étroit... (Niels Bohr)
    Mes recettes python: http://www.jpvweb.com

  3. #23
    Membre chevronné
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 608
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 608
    Points : 2 072
    Points
    2 072
    Par défaut
    Merci à vous, je suis effectivement passé par wget, bien que ce ne soit mon voeu initial.
    Cela a le mérite de marcher...
    Cela fonctionne sous python 2 et 3.
    On peut le faire aussi directement en ligne de commande (au moins sous linux).
    Voici mon code au cas où :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    import subprocess
     
    url="http://le_site_a_télécharger/"
    subprocess.call(["wget", "-r", "-np", "-nd", "-A.jpg", "-A.tex", url])
    Pas d'aide par mp.

+ Répondre à la discussion
Cette discussion est résolue.
Page 2 sur 2 PremièrePremière 12

Discussions similaires

  1. Créer un site web - en quel langage ?
    Par Thierry92 dans le forum Débuter
    Réponses: 94
    Dernier message: 22/04/2024, 21h44
  2. aspirateur d'email pour site web
    Par Gregco dans le forum Internet
    Réponses: 4
    Dernier message: 05/11/2010, 10h23
  3. [Aspirateur] téléchargement de sites web
    Par Seifer dans le forum Dépannage et Assistance
    Réponses: 3
    Dernier message: 11/12/2006, 10h52
  4. [Juridique] Légal les aspirateurs de site web ?
    Par Hedi1 dans le forum Juridique
    Réponses: 7
    Dernier message: 10/10/2006, 13h10

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo