IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Macros et VBA Excel Discussion :

VBA Scraping WEB


Sujet :

Macros et VBA Excel

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Août 2024
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Calvados (Basse Normandie)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Conseil

    Informations forums :
    Inscription : Août 2024
    Messages : 5
    Par défaut VBA Scraping WEB
    Bonjour à tous !

    besoin d'un coup de main je ne comprend pas pourquoi tout se decale j'aimerai les Dots en face des bonnes villes
    merci a vous
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
     
    Public Sub GetContents()
     
        Dim XMLReq As New MSXML2.XMLHTTP60
        Dim HTMLDoc As New MSHTML.HTMLDocument
     
        XMLReq.Open "Get", "https://brocabrac.fr/14/", False
        XMLReq.send
     
        HTMLDoc.body.innerHTML = XMLReq.responseText
     
        Dim SubSectList As Object, SubSect As Object
     
        Set SubSectList = HTMLDoc.getElementsByClassName("ev-section")
     
        Dim cit As Object
        Dim dots As Object
        Dim day As Object
        Dim addr As Object
     
     
        r = 1
     
     
        For Each SubSect In SubSectList
     
            For Each cit In SubSect.getElementsByClassName("city")
     
                ActiveSheet.Cells(r + 1, 1) = cit.innerText & " : " & cit.NextSibling.NextSibling.innerText
     
     
                r = r + 1
     
            Next
     
              For Each day In SubSect.getElementsByClassName("day")
     
                ActiveSheet.Cells(r, 2) = day.innerText & " : " & day.NextSibling.NextSibling.innerText
     
     
                r = r + 1
     
     
            Next
     
             For Each dots In SubSect.getElementsByClassName("dots")
     
                ActiveSheet.Cells(r, 4) = dots.innerText & " : " & dots.NextSibling.NextSibling.innerText
     
                r = r + 1
     
     
            Next
     
     
     
     
        Next
     
     
     
    End Sub

  2. #2
    Membre chevronné
    Homme Profil pro
    CIP
    Inscrit en
    Avril 2024
    Messages
    200
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : CIP
    Secteur : Service public

    Informations forums :
    Inscription : Avril 2024
    Messages : 200
    Par défaut re
    Bonjour
    en fait tu es loin du compte
    la page est affublé de script qui modifie le html en fonction de la version de l'explorateur
    de plus la fonction getelementsbyclassname d'aussi loin que je me souvienne est capricieuse selon les page web et déclenche parfois une erreurS
    de plus du récupère le code par une requete et envoie le html dans le body du htmldocument en mémoire
    ce qui a pour conséquence que les scripts ne s’exécutent pas

    et pour finir la première chose que tu dois faire avant de te lancer dans un projet DE GRABBING WEB
    c'est d'aller lire la règlementation notamment la CGU
    Nom : Capture.JPG
Affichages : 280
Taille : 104,6 Ko

  3. #3
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Août 2024
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Calvados (Basse Normandie)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Conseil

    Informations forums :
    Inscription : Août 2024
    Messages : 5
    Par défaut
    "L’extraction à des fins privées est autorisée, dans le respect des dispositions législatives et réglementaires en matière de droits d’auteurs et de droits voisins sur les œuvres ou les éléments incorporés dans la base."

    du coup ou est la limite ?

    Citation Envoyé par patmeziere Voir le message
    Bonjour
    en fait tu es loin du compte
    la page est affublé de script qui modifie le html en fonction de la version de l'explorateur
    de plus la fonction getelementsbyclassname d'aussi loin que je me souvienne est capricieuse selon les page web et déclenche parfois une erreurS
    de plus du récupère le code par une requete et envoie le html dans le body du htmldocument en mémoire
    ce qui a pour conséquence que les scripts ne s’exécutent pas

    et pour finir la première chose que tu dois faire avant de te lancer dans un projet DE GRABBING WEB
    c'est d'aller lire la règlementation notamment la CGU
    Nom : Capture.JPG
Affichages : 280
Taille : 104,6 Ko

  4. #4
    Membre chevronné
    Homme Profil pro
    CIP
    Inscrit en
    Avril 2024
    Messages
    200
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : CIP
    Secteur : Service public

    Informations forums :
    Inscription : Avril 2024
    Messages : 200
    Par défaut
    Bonsoir
    la limite???
    ben c'est simple a partir du moment ou quelqu'un te donne sur le forum une solution ce n'est plus privé puisqu’à la vue de tous
    on est donc en pleine infraction qui est diffusion de contenu ou parti de contenu de droit d'auteur et de propriété intellectuelle

  5. #5
    Expert confirmé
    Avatar de jurassic pork
    Homme Profil pro
    Bidouilleur
    Inscrit en
    Décembre 2008
    Messages
    4 228
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Bidouilleur
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2008
    Messages : 4 228
    Par défaut
    Hello,
    comme l'indique patmeziere, le html que tu récupères possède des scripts javascript et donc ce qui est affiché par un navigateur ne correspond pas au source html. Pour avoir le code html affiché il faut piloter un navigateur comme par exemple avec CDP (voir ici). Mais le souci c'est que ton site n'aime pas les bloqueurs de publicité et il faut donc activer les pubs pour ce site. Cela fait que dans le code HTML il y a des morceaux pour la pub qui compliquent sacrément la récolte des infos automatiquement car ces codes se trouvent parmi les infos à récolter. En plus c'est le genre de pubs qui m'énervent sacrément car ça te lance des vidéos etc... et ça te ralentit le chargement de la page. Sur Developpez les pubs au moins sont discrètes, si tout le monde pouvait faire comme ça !
    Ami calmant, J.P

  6. #6
    Membre chevronné
    Homme Profil pro
    CIP
    Inscrit en
    Avril 2024
    Messages
    200
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : CIP
    Secteur : Service public

    Informations forums :
    Inscription : Avril 2024
    Messages : 200
    Par défaut re
    Bonsoir jurassic pork

    non perso j'ai réussi a chopper les données en moins d'une minute
    le problème c'est que le site annonce clairement explicitement ses conditions d'utilisation
    Nom : Capture.JPG
Affichages : 153
Taille : 325,0 Ko

  7. #7
    Expert confirmé
    Avatar de jurassic pork
    Homme Profil pro
    Bidouilleur
    Inscrit en
    Décembre 2008
    Messages
    4 228
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Bidouilleur
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2008
    Messages : 4 228
    Par défaut
    hello, patmeziere
    Citation Envoyé par patmeziere Voir le message
    Bonsoir jurassic pork
    non perso j'ai réussi a chopper les données en moins d'une minute
    Avec le source HTML ?

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [XL-2007] Intéraction VBA et WEB
    Par clem4491 dans le forum Excel
    Réponses: 1
    Dernier message: 24/10/2014, 11h31
  2. Réponses: 2
    Dernier message: 16/09/2014, 13h01
  3. [XL-2010] VBA requete web - problème: identifiant et mot de passe
    Par Jambon-Beurre dans le forum Macros et VBA Excel
    Réponses: 5
    Dernier message: 13/09/2014, 16h11
  4. VBA et Web services
    Par Oliv'67 dans le forum Général VBA
    Réponses: 1
    Dernier message: 24/08/2012, 09h43
  5. VBA : Service Web avec SOAP et HTTPS
    Par uftu1 dans le forum VBA Access
    Réponses: 1
    Dernier message: 06/09/2007, 12h02

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo