IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Extraire des données d’une page web avec R


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    Inscrit en
    Décembre 2008
    Messages
    50
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Vaucluse (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Décembre 2008
    Messages : 50
    Par défaut Extraire des données d’une page web avec R
    Bonsoir tout le monde (formule pour ne pas s'embarrasser avec l'écriture inclusive lol)
    Plus sérieusement voici mon problème : je veux récupérer les données d'une page web
    Les données sont incluses dans une table dont je ne récupère que les dix premiers enregistrements. En bas de la table il y a un bouton pour développer la table et c'est là qu'est ma question : comment afficher toute la table. Autrement dit comment simuler un clic sur le bouton "PLUS". Voici mon code :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    doc <- readHTMLTable("http://www.france-galop.com/fr/cheval/Q2NZc0swTWl3dXFieG1MeEFSei9GQT09",
                                       header = FALSE, stringsAsFactors = FALSE)
    doc1 <- as.data.frame(doc[2])
    Ça fonctionne mais c'est insuffisant. Si quelqu'un a une idée? Merci beaucoup ça fait déjà trop longtemps que je cherche éperdument sur google...

  2. #2
    Membre chevronné
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    Janvier 2012
    Messages
    325
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Janvier 2012
    Messages : 325
    Par défaut
    La page fait appel à du javascript pour afficher plus de résultats donc c'est mort pour simuler un clic avec R.

    En regardant les requêtes envoyées quand on clique sur le boutton on voit que les url du type http://www.france-galop.com/fr/frglp...30&racetrack=0 renvoient ce que tu veux.

    Par contre c'est du json et pas du HTML donc il va falloir que tu revois ton code (il y a des packages pour parser le json en R donc pas de soucis).

  3. #3
    Membre averti
    Homme Profil pro
    Inscrit en
    Décembre 2008
    Messages
    50
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Vaucluse (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Décembre 2008
    Messages : 50
    Par défaut
    Merci Theta. Je vais regarder cela tout de suite mais le json je n'ai encore jamais vu, j'ai de quoi m'occuper un moment. Accessoirement pourrais tu me dire comment tu accèdes aux requêtes envoyées par la page?

  4. #4
    Membre chevronné
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    Janvier 2012
    Messages
    325
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Janvier 2012
    Messages : 325
    Par défaut
    Avec firefox : Menu "principal" / Développement Web / Réseau

    Ça existe aussi dans les autres navigateurs.

  5. #5
    Membre averti
    Homme Profil pro
    Inscrit en
    Décembre 2008
    Messages
    50
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Vaucluse (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Décembre 2008
    Messages : 50
    Par défaut
    Citation Envoyé par Theta Voir le message
    Avec firefox : Menu "principal" / Développement Web / Réseau

    Ça existe aussi dans les autres navigateurs.
    L'équivalent existe effectivement dans chrome mais ni dans l'un ni dans l'autre je n'ai réussi à trouver cette URL. Je ne dois pas chercher où il faut...
    Sinon le json c'est génial. La table que je récupère est beaucoup plus exploitable que ce que je faisais en html. Merci

  6. #6
    Membre averti
    Homme Profil pro
    Inscrit en
    Décembre 2008
    Messages
    50
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Vaucluse (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Décembre 2008
    Messages : 50
    Par défaut
    Ça y est j'ai trouvé. Merci pour le coup de main.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Comment extraire des données depuis le web
    Par ahmedpa dans le forum Général Java
    Réponses: 2
    Dernier message: 12/03/2015, 19h45
  2. Récupérer les données d’une page web et les incorporer dans un tableau
    Par miss_ana dans le forum Collection et Stream
    Réponses: 2
    Dernier message: 26/05/2014, 11h16
  3. Réponses: 4
    Dernier message: 02/05/2010, 11h59
  4. Réponses: 8
    Dernier message: 06/03/2008, 16h32
  5. [VB]stocker des données de pages web dans une base
    Par tofito dans le forum VB 6 et antérieur
    Réponses: 3
    Dernier message: 15/02/2006, 11h02

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo