IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Macros et VBA Excel Discussion :

Récupération de données HTML [XL-2010]


Sujet :

Macros et VBA Excel

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Homme Profil pro
    Inscrit en
    Août 2011
    Messages
    113
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Août 2011
    Messages : 113
    Par défaut
    Bonjour à tous,

    Je souhaite récupérer des données d'un site web et les retranscrire sur Excel.
    Je l'ai déjà fait sur un autre site, mais là je bloque sur la partie récupération de données.
    Voici le code HTML de la partie qui m'intéresse :
    Code html : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    <div id="fiche_entreprise">
    	<table width="600">
    		Info non pertinante
    	</table>
     
    	<h4>Catégorie 1</h4>
    	<table class="table">
    		<tr>
    			<td class="fiche_tdhead">Sous-catégorie 1.A</td>
    			<td>Donnée 1.A</td>
    		</tr>
    		<tr>
    			<td class="fiche_tdhead">Sous-catégorie 1.B</td>
    			<td>Donnée 1.B</td>
    		</tr>
    		<tr class="highlight">
    			<td class="fiche_tdhead">Sous-catégorie 1.C</td>
    			<td>Donnée 1.C</td>
    		</tr>
    	</table>
     
    	<H4>Catégorie 2</H4>
    	<table class="table">
    		<tr class="highlight">
    			<td class="fiche_tdhead">Sous-catégorie 2.A</td>
    			<td>Donnée 2.A</td>
    		</tr>
    	</table>
     
    	<h4>Catégorie 3</h4>    
    	<table class="table chiffres">
    		<thead>
    			<tr>
    				<th style="font-style: italic;"></th>
    				<th class="text-right">
    					<a href="/produits/520231929/2014/">2014</a>
    				</th>
    				<th class="text-right">
    					<a href="/produits/520231929/2013/">2013</a>
    				</th>
    				<th class="text-right">
    					<a href="/produits/520231929/2012/">2012</a>
    				</th>
    			</tr>
    		</thead>
    		<tbody>
    			<tr><td class="">Sous-catégorie 3.A</td>
    				<td class="text-right">Donnée 3.A.1</td>
    				<td class="text-right">Donnée 3.A.2</td>
    				<td class="text-right">Donnée 3.A.3</td>
    			</tr>
    			<tr class="highlight"><td class="label">Sous-catégorie 3.B</td>
    				<td class="text-right">Donnée 3.B.1</td>
    				<td class="text-right">Donnée 3.B.2</td>
    				<td class="text-right">Donnée 3.B.3</td>
    			</tr>
    		</tbody>
    	</table>
     
    	<table class="table actionnaire">
    		<tbody>
    			Pas d'info
    		</tbody>
    	</table>
     
    	<h4>Catégorie 5</h4>
    	<div id="verif_fiche_entreprise_actionnaires_filiales_coeur">
    		<table class="table" cellspacing="0" cellpadding="0" border="0" width="598">
    			<thead>
    				<tr class="verif_fiche_entreprise_bold">
    					<th class="verif_labeltbl">Adresse</th>
    					<th class="verif_labeltblbis"><span class="verif_bordbl">Téléphone</span></th>
    					<th class="verif_labeltblbis"><span class="verif_bordbl">Fax </span></th>
    					<th class="verif_labeltblbis"><span class="verif_bordbl">Statut</span></th>
    				</tr>
    			</thead>
    			<tbody>
    				<form action="/etablissements-secondaires//" method="POST" name="etab" id="verif_idetab">
    					<input type="hidden" name="nic" id="verif_idNIC" value="">
    				</form>
    				<tr class="highlight">
    					<td height="30">
    						<span class="verif_repsbeltbl"> Rue </span><br/>
    						<span class="verif_repsbeltbl">CP + Ville</span>
    					</td>
    					<td class="verif_bordbl">N.C.</td>
    					<td class="verif_bordbl">N.C.</td>
    					<td class="verif_bordbl">Actif</td>
    				</tr>
    			</tbody>
    		</table>
    	</div>
    </div>

    Pour l'instant, j'ai pu récupérer les noms des catégories, présents dans les balises h4.
    Mais je bloque sur les sous-catégories et les données, sachant que je veux associer les sous-catégories aux catégories (donc pas de récupération de l'ensemble des balises td d'un bloc, mais plutôt en partant sur une boucle For j = 1 To Nb_Categories)

    J'avais pensé au children(), mais le nombre de balises h4 n'est pas toujours identique au nombre de balises table suivant la page scannée (par exemple, ici, il n'y a pas de catégorie 4).

    J'avais également pensé regroupé le contenu de chaque <table> dans une variable object du style TagHtml_table(3) = contenu du 4ème bloc table, et donc de la 3ème catégorie, mais je ne sais pas comment faire.

    Quelqu'un a-t-il une idée pour m'aider à sortir de cette impasse ?
    Merci d'avance

    Je tente le code suivant :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    Set mon_elem = IEDoc.all("fiche_entreprise")
    For j = 1 To nbCat
        Set TagHtml_tr = mon_elem.Children(1 + j).all   'Pour j=1, on liste la 1ère balise table
        Set TagHtml_tr = TagHtml_tr.getElementsByTagName("tr") 'On liste les éléments de type tr (chaque balise <tr ...> contient le nom d'une sous-catégorie et la donnée correspondante)
    Ce n'est pas optimisé, mais je n'effectue pour l'instant le test que sur j=1

    Pourquoi ai-je une erreur
    Propriété ou méthode non gérée par cet objet
    sur la dernière ligne ?

  2. #2
    Inactif  

    Homme Profil pro
    cuisiniste
    Inscrit en
    Avril 2009
    Messages
    15 374
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : cuisiniste
    Secteur : Bâtiment

    Informations forums :
    Inscription : Avril 2009
    Messages : 15 374
    Billets dans le blog
    8
    Par défaut re
    bonjour
    décdement c'est pas encore bien rentré dan ta tete
    ici tu cherche une ligne dans une ligne
    c'est un peu chercher du chocolat dans du chocolat
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    Set TagHtml_tr = TagHtml_tr.getElementsByTagName("tr")
    et puis vu la structure du code html que tu a posté c'a n'est pas comme ca qu'il faut procéder
    car chaque balises "H4" n'est pas le parent de la table il te faut donc astucer numeriquement dans le decompte dans une boucle
    pour faire en sorte que le h4(1) corresponde a la table (1) etc......

    il me semble te l'avoir expliqué non?

    bon j'ai copier le code html dans un fichier en local pour l'experience
    ca donne ca
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    Sub test()
    Dim ie, url, iedoc
    url = "C:\Users\polux\Desktop\wwww.html"
     Set ie = CreateObject("internetexplorer.application")
     ie.navigate url
     ie.Visible = True
     
     Do: DoEvents: Loop While ie.readystate <> 4 Or ie.busy
     Set iedoc = ie.document
     
     Set mondiv = iedoc.getelementbyid("fiche_entreprise")
     Set mestitreh4 = mondiv.getelementsbytagname("H4")
     Set mestables = mondiv.getelementsbytagname("table")
       For i = 0 To mestitreh4.Length - 1
     MsgBox mestitreh4(i).innertext & vbCrLf & mestables(i + 1).innertext
    'ici faire une sous boucle sur les enfants de la tables pour recupérer un element ou un autre 
    Next
      End Sub
    mes fichiers dans les contributions:
    mail avec CDO en vba et mail avec CDO en vbs dans un HTA
    survol des bouton dans userform
    prendre un cliché d'un range

    si ton problème est résolu n'oublie pas de pointer : : ça peut servir aux autres
    et n'oublie pas de voter

  3. #3
    Membre confirmé
    Homme Profil pro
    Inscrit en
    Août 2011
    Messages
    113
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Août 2011
    Messages : 113
    Par défaut
    Alors là, je ne comprends plus. Il me semblait avoir essayé de passer par
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    Set mestables = mondiv.getelementsbytagname("table")
    , mais avoir abandonné suite à un message d'erreur...
    Et pourtant, j'avais procédé de la sorte pour la balise h4

    La fatigue peut-être, à force de rester sur ce fichier...

    C'est bon, j'ai bien ma liste de table à présent

    En tout cas, merci beaucoup pour ton aide et pour me remettre les esprits en place
    Comme quoi c'est toujours utile d'avoir un regard extérieur

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Récupération de données HTML
    Par InfoNewbie dans le forum Général JavaScript
    Réponses: 3
    Dernier message: 16/03/2009, 17h59
  2. Réponses: 31
    Dernier message: 27/07/2006, 13h51
  3. Réponses: 2
    Dernier message: 04/06/2006, 20h11
  4. [HTML][FORMULAIRE] Probleme dans la récupération des données
    Par baddounet dans le forum Balisage (X)HTML et validation W3C
    Réponses: 6
    Dernier message: 15/08/2005, 18h51

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo