Bonjour,
je cherche à récupérer les présentations d'une liste de chaînes Youtube.
Pour ce faire, l'idée est de récupérer le code html de la page présentation et d'extraire ce qui se trouve entre les balises html <pre> et </pre>.
J'utilise le code suivant (les lignes en gras sont utilisées pour débuguer)
Problème: ma variable html_code, qui contient 110527 caractères, ne contient pas l'intégralité du code html (190 189 caractères).
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25 Dim InternetWindow As New InternetExplorer Dim html_code As String Set ws = Sheets("Feuil1") InternetWindow.Visible = False InternetWindow.Navigate (Sheets("Feuil1").Range("A1")) Do DoEvents Loop Until InternetWindow.ReadyState = READYSTATE_COMPLETE html_code = InternetWindow.Document.Body.innerHTML With New DataObject .SetText html_code .PutInClipboard End With MsgBox Len(html_code) pre_first = InStr(1, html_code, "<pre>") pre_first_offset = pre_first + 5 pre_last = InStr(1, html_code, "</pre>") len_presentation = pre_last - 1 - pre_first_offset presentation_chaine = Mid(html_code, pre_first_offset, len_presentation) Range("A2") = presentation_chaine
D'où cela peut-il venir sachant qu'html_code est déclaré en string, qui théroiquement peut contenir 2^31 caractères.
D'avance merci.
Partager