IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Capter les parties occultées de pages internet


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Nouveau candidat au Club
    Homme Profil pro
    faneur flâneur
    Inscrit en
    Avril 2020
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : faneur flâneur

    Informations forums :
    Inscription : Avril 2020
    Messages : 1
    Par défaut Capter les parties occultées de pages internet
    Salutation à toutes et à tous

    Je voudrais comprendre comment procéder pour capturer le contenu total de certaines pages internet qui présentent des parties occultées,
    c'est à dire des parties qu'on ne peut voir que si on les fait apparaitre en cliquant sur un texte "réactif".


    Je prends l'exemple des pages de news yahoo telles que celle-ci :
    https://fr.news.yahoo.com/sanofi-vac...084452404.html

    À l'ouverture d'une page de news, les réactions sont occultées.
    Elles n'apparaissent que si l'on clique sur le texte "réactif" suivant:
    Nom : Voir les réactions.PNG
Affichages : 87
Taille : 1,1 Ko
    Puis dans la liste des réactions, il y a encore des parties occultées tant qu'on ne clique pas sur les textes "réactifs" suivants :
    Nom : Réponses.PNG
Affichages : 77
Taille : 656 octets
    Nom : Plus.PNG
Affichages : 78
Taille : 441 octets
    Nom : Afficher plus.PNG
Affichages : 79
Taille : 1,2 Ko
    Ce mode d'affichage rend la lecture des réactions très pénibles.


    Je sais fetcher le contenu d'une page internet mais dans le code de page que je capture d'une news yahoo, je ne trouve pas les réactions.

    Je sollicite de l'aide pour:

    1) savoir quel est le processus sous-jacent aux textes réactifs qui font apparaître les parties occultées.
    Je suppose sans grande certitude qu'il y a du Javascript là-dessous.
    Mais ne maîtrisant un tant soit peu que Python, je ne veux pas me lancer dans l'étude d'un domaine sans avoir été conseillé

    2) être mis sur la piste des outils Python qui pourraient effectuer programmatiquement les mêmes effets que les clics sur textes réactifs,
    afin de pouvoir télécharger un contenu de page qui contienne tout du premier coup

    Merci pour votre attention

  2. #2
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 754
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 754
    Par défaut
    Salut,

    Pour faire çà, il faut exécuter le javascript dans la page DOM. Ce que fait assez bien un navigateur Web. Donc l'idée est de contrôler "programmatiquement" un navigateur Web pour lui faire faire les clicks où il faut, charger les informations et les récupérer pour les analyser.

    Techniquement Selenium fait çà assez bien mais vous avez besoin d'outils annexes pour le reste.
    Chercher sur Internet avec les mots clefs "python scraping selenium", vous permettra (sans doute) d'avancer.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

Discussions similaires

  1. Réponses: 2
    Dernier message: 21/06/2011, 12h06
  2. Réponses: 12
    Dernier message: 28/05/2011, 12h53
  3. [AJAX] Rafraichir une partie de la page toutes les secondes
    Par identifiant_bidon dans le forum AJAX
    Réponses: 13
    Dernier message: 20/03/2011, 08h18
  4. [AC-2007] récupérer les données d'une page internet
    Par Eric Guérin dans le forum VBA Access
    Réponses: 3
    Dernier message: 01/04/2009, 15h37
  5. Réponses: 11
    Dernier message: 04/10/2007, 08h02

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo