IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Réseau/Web Python Discussion :

Récupérer l'adresse de la page web suivante


Sujet :

Réseau/Web Python

  1. #1
    Membre à l'essai
    Homme Profil pro
    Enseignant
    Inscrit en
    Avril 2014
    Messages
    22
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Maine et Loire (Pays de la Loire)

    Informations professionnelles :
    Activité : Enseignant

    Informations forums :
    Inscription : Avril 2014
    Messages : 22
    Points : 23
    Points
    23
    Par défaut Récupérer l'adresse de la page web suivante
    Bonjour

    Je tente de scraper avec scrapy un site web pour mon activité afin de mettre à jour mes tarifs rapidement.
    J'avais un peu d'expérience en C++ il y a 25 ans alors, je me lance.
    Je découvre python et sa puissance. C'est exceptionnel ce que l'on peut faire avec 3 lignes de codes.
    Bref, voici mon problème
    Je n'arrive pas à extraire l'adresse mail de la page suivante. Je galère avec la syntaxe.

    Voici l'extrait du code source du site web que je veux scraper
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
     
    <div class="pagination">
       <ul>
         <ul aria-labelledby="paging-label">
             <li><strong>1</strong></li>
             <li><a href="https://www.123elec.com/photovoltaique.html?p=1">1</a></li>
             <li><a href="https://www.123elec.com/photovoltaique.html?p=2">2</a></li>
             <li><a href="https://www.123elec.com/photovoltaique.html?p=3">3</a></li>
             <li><a href="https://www.123elec.com/photovoltaique.html?p=4">4</a></li>
             <li><a href="https://www.123elec.com/photovoltaique.html?p=5">5</a></li>
             <li>
                <a href="https://www.123elec.com/photovoltaique.html?p=4">
                    <i class="icon icon_button_arrow-1-right mobile-only"></i>
                    <span class="no-mobile">Suivant</span>
                </a>
             </li>
          </ul>
       </ul>
    </div>
    Je voudrais récupérer le lien associé du bouton suivant (https://www.123elec.com/photovoltaique.html?p=4). Si vous avec une astuce, je suis preneur.

  2. #2
    Membre expert
    Homme Profil pro
    Inscrit en
    Octobre 2011
    Messages
    2 874
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Octobre 2011
    Messages : 2 874
    Points : 3 721
    Points
    3 721
    Par défaut
    Salut,
    Citation Envoyé par artazis Voir le message
    Je voudrais récupérer le lien associé du bouton suivant (https://www.123elec.com/photovoltaique.html?p=4). Si vous avec une astuce, je suis preneur.
    Ben il suffit d’incrémenter le numéro, ici remplacer p=4 par p=5 ...

    Mais peut-être que je n'ai pas bien compris la question ?

  3. #3
    Membre à l'essai
    Homme Profil pro
    Enseignant
    Inscrit en
    Avril 2014
    Messages
    22
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Maine et Loire (Pays de la Loire)

    Informations professionnelles :
    Activité : Enseignant

    Informations forums :
    Inscription : Avril 2014
    Messages : 22
    Points : 23
    Points
    23
    Par défaut
    Citation Envoyé par Beginner. Voir le message
    Salut,
    Ben il suffit d’incrémenter le numéro, ici remplacer p=4 par p=5 ...

    Mais peut-être que je n'ai pas bien compris la question ?
    Merci pour cette suggestion.

    Oui, c'est ce que je viens de faire. Je trouvais ça plus classe de prendre l'url dans href du code source du site.
    Je fais un test pour vérifier que le bouton suivant existe pour continuer à scraper les pages. Il peut y en avoir un paquet et c'est évolutif.

Discussions similaires

  1. récupérer le contenu d'une page web
    Par marielaure2805 dans le forum Langage
    Réponses: 4
    Dernier message: 28/02/2007, 13h12
  2. Récupérer le contenu d'une page web
    Par smarties dans le forum Entrée/Sortie
    Réponses: 2
    Dernier message: 13/02/2007, 01h25
  3. récupérer des infos d'une page web (TWebBrowser)
    Par LotfiB dans le forum C++Builder
    Réponses: 3
    Dernier message: 16/01/2007, 21h59
  4. [RegEx] Récupérer des données dans une page Web
    Par Pragmateek dans le forum Langage
    Réponses: 8
    Dernier message: 24/05/2006, 19h44
  5. [Servlet]Récupérer le contenu d'une page web
    Par Jarodnet dans le forum Servlets/JSP
    Réponses: 6
    Dernier message: 06/10/2005, 15h47

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo