IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Réseau/Web Python Discussion :

[Pyhton3.x] possible de websrcapper plusieurs pages dont l'url n'est pas connu d'avance?


Sujet :

Réseau/Web Python

  1. #1
    Nouveau membre du Club
    Homme Profil pro
    chomeur
    Inscrit en
    Mai 2022
    Messages
    83
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : chomeur

    Informations forums :
    Inscription : Mai 2022
    Messages : 83
    Points : 37
    Points
    37
    Par défaut [Pyhton3.x] possible de websrcapper plusieurs pages dont l'url n'est pas connu d'avance?
    Bonjour
    est-il possible de webscrapper les pages linkedin?
    j'aimerai juste récupérer le nom des personnes d'une entreprise
    Pour une page donnée, je pense que je sais le faire avec beautifulsoup.

    par exemple avec cette page:
    https://www.linkedin.com/search/resu...SEARCH&sid=ZFf
    , je pense que je sais faire. jai regardé le code html et j'ai repéré le balises.

    le probleme, c'est que j'ai 10 pages de la sorte et l'url de chaque page est différente, les derniers caractères semblent être aléatoire et je ne vois comment comment charger ces url en avance.
    https://www.linkedin.com/search/resu...page=2&sid=ZFf
    https://www.linkedin.com/search/resu...page=3&sid=dhF


    Dans ce cas là, c'est possible de webscrapper?

  2. #2
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 287
    Points : 36 776
    Points
    36 776
    Par défaut
    Salut,

    La difficulté du "scrapping" est de trouver comment scrapper... mais ce n'est pas parce que vous programmer avec Python que ça en fait un sujet pour ce langage là pour autant (il y a une rubrique Web...).
    note: récupérer les informations pour fabriquer l'URL... dépend du site Web pas du langage.

    Sachez aussi que le "scrapping" (au sens automatiser la navigation sur un site Web comme le ferait un utilisateur derrière son navigateur) n'est pas la seule option pour "interagir" avec des site Web qui ont une API programmatique (comme linkedin).

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

Discussions similaires

  1. Réponses: 2
    Dernier message: 20/06/2014, 17h50
  2. Réponses: 5
    Dernier message: 05/03/2013, 12h19
  3. [Toutes versions] Lire un fichier texte dont l'encoding n'est pas connu
    Par jemore22 dans le forum Macros et VBA Excel
    Réponses: 4
    Dernier message: 13/01/2012, 09h28
  4. Réponses: 12
    Dernier message: 08/11/2010, 19h23

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo