impossible de récupérer le source HTML d'une page web
Bonjour à tous,
Je cherche à récupérer des informations et entre autre des liens sur une page web,
mais malgré des tests avec pas mal de codes différents, j'ai une page qui est récalcitrante.
Je vous mets un code qui fonctionne pour d'autres pages,
mais qui ne donne pas le résultat souhaité sur la page affichée en commentaire.
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
| Option Explicit
Public ReQ As Object, doc As Object, elm As Object, grp As Object, tbl As Object, rng As Range, idx As Long, pos As Long, tmp
Public Sub rep_part() ' site partants web
Call recup_page(Range("s_part")) ' http://www.paris-courses.com/courses-hippiques/pid275-les-reunions-du-jour.html?day=tomorrow
With doc
.body.innerhtml = ReQ.responseText
tmp = .ParentWindow.clipboardData.SetData("text", .body.innerhtml)
With Feuil1
.Activate
Set rng = .Cells(1, 1)
rng.Activate
.Paste
End With
End With
End Sub
Public Sub recup_page(adr) ' connexion site
Set ReQ = CreateObject("microsoft.xmlhttp")
ReQ.Open "POST", adr, False
ReQ.setRequestHeader "Accept", "text/html, application/xhtml+xml, */*"
ReQ.setRequestHeader "Accept-Language", "fr-FR"
ReQ.setRequestHeader "User-Agent", "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)"
ReQ.setRequestHeader "Accept-Encoding", "gzip, deflate"
ReQ.setRequestHeader "Host", "www.geny.com"
ReQ.setRequestHeader "DNT", 1
ReQ.setRequestHeader "Connection", "Keep - Alive"
ReQ.setRequestHeader "Cookie", " JSESSIONID=3E554B80B1ABBC36A2C53EC91C219C77.raoul_1;"
ReQ.Send
Set doc = CreateObject("htmlfile")
End Sub |
Si un spécialiste peux me donner une façon de résoudre le souci, je l'en remercie par avance.