Récupérer du texte sur une page web
Bonjour,
Voici mon projet :
- développer un outil permettant de rédiger les contrats de façon automatique.
Pour cela, j'ai besoin de me connecter au site societe.com puis de récupérer certaines informations, à savoir :
- la forme juridique
- le nom commercial de l'entreprise
- l'adresse postale
- le numéro de SIRET
- le numéro de TVA intracommunautaire
- le numéro RCS
- le capital social
Dans mon outil Excel je possède déjà le numéro de SIRET par un autre biais. Je me connecte alors sur la page societec.com correspondant au SIRET recherché mais ensuite j'aurais besoin de récupérer les autres informations listées ci dessus.
Voici mon code pour récupérer par exemple la forme juridique :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| Sub IETest5()
Dim ie As New InternetExplorer
ie.Visible = True
ie.navigate "https://www.societe.com/societe/" & Range("E20").Value & "-" & Range("AK2").Value & ".html"
Do While ie.Busy
Application.Wait DateAdd("s", 1, Now)
Loop
Dim HTMLDoc As HTMLDocument
Set HTMLDoc = ie.document
StatutJuridique = document.getElementById("catjur-histo-description")
MsgBox StatutJuridique
End Sub |
Pourriez vous m'aider ?
D'avance merci !
Récupérer du texte sur SOCIETE.COM
Bonjour,
Je tiens à présenter mes excuses... c'est vrai que je n'ai pas expliqué jusqu'au bout ce qui ne fonctionne pas avec mon code ... En réalité, je n'arrive pas à remonter les informations avec ce que j'ai écris... mais peut être est ce du au fait que ces données soient protégées...
Pour être parfaitement clair, hier j'ai de nouveau essayé de retravailler mon code :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
| Sub VBA_Webscrap()
'to refer to the running copy of Internet Explorer
Dim ie As InternetExplorer
'to refer to the HTML document returned
Dim IEdoc As IHTMLElement
Dim resultat As Range
Set resultat = Worksheets("Menu").Range("AZ1")
'open Internet Explorer in memory, and go to website
Set ie = New InternetExplorer
ie.Visible = True
ie.navigate "https://www.societe.com/societe/" & Range("E20").Value & "-" & Range("AK2").Value & ".html"
WaitIE ie
Set IEdoc = ie.html => ligne à l'origine de l'erreur
'get a reference to the articles header. The text is stored in the first item within the element.
resultat = IEdoc.getElementsByClassName("catjur-histo-description").innerText
MsgBox resultat
Set resultat = Nothing
Set html = Nothing
End Sub |
=> mais j'obtiens le message d'erreur
Citation:
Erreur 438 - Propriété ou méthode non gérée
j'ai ensuite essayé le code suivant :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
| Sub TEST6()
'to refer to the running copy of Internet Explorer
Dim ie As New InternetExplorer
'to refer to the HTML document returned
Dim IEdoc As HTMLDocument
'open Internet Explorer in memory, and go to website
ie.navigate "https://www.societe.com/societe/" & Range("E20").Value & "-" & Range("AK2").Value & ".html"
ie.Visible = True
'use the below set of Do's together to wait for the website to do work
Do Until ie.readyState = READYSTATE_COMPLETE
DoEvents
Loop
Set IEdoc = ie.document
'get a reference to the articles header. The text is stored in the first item within the element.
document.getElementsByClassName ("break-word") => ligne à l'origine de l'erreur
ActiveSheet.Range(AZ1) = firstHeaderElement.innerHTML
Set html = Nothing
End Sub |
=> mais j'obtiens le message d'erreur
Citation:
Erreur d'exécution 424 - Objet requis
Y a t il réellement une solution ou est ce impossible de part la protection des données ?
D'avance merci !