Je veux lire un code source à partir d'une page Web et en extraire des données.
J'ai utilisé ici dans mon exemple une RegEx pour extraire les données, mais je n'ai pas eu toutes les données, peut-être cela est dû à l'unicode ou le modèle ne correspond pas?
Quand je teste ce modèle avec RegExBuddy, cela correspond, mais avec vbscript j'obtiens rien ?
Merci de votre aide !
Donc, le résultat que j'attends est:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28 sSrcUrl = "https://fr.giveawayoftheday.com/" Set oHTTP = CreateObject("MSXML2.ServerXMLHTTP.6.0") bGetAsAsync = False oHTTP.open "GET", sSrcUrl, bGetAsAsync oHTTP.send If oHTTP.status <> 200 Then WScript.Echo "unexpected status = " & oHTTP.status & vbCrLf & oHTTP.statusText WScript.Quit End If Data = oHTTP.responseText wscript.echo Extract(Data) '**************************************************************** Function Extract(Data) Dim oRE,oMatches,Match,Line set oRE = New RegExp oRE.IgnoreCase = True oRE.Global = True oRE.MultiLine = True oRE.Pattern = "<div class=""giveaway_wrap cf"">(\r.*\n.*){17}</div>" set oMatches = oRE.Execute(Data) If not isEmpty(oMatches) then For Each Match in oMatches Line = Match.Value Extract = Line Next End if End Function '*****************************************************************
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18 <div class="giveaway_wrap cf"> <div class="giveaway_img"> <img src="https://giveawayoftheday.com/wp-content/uploads/2017/10/82810932353ab590bf475ea3980f3038.png" alt="Excel Url Validator 1.0 Giveaway" /> <div class="giveaway_label"> <a href="https://fr.giveawayoftheday.com/excel-url-validator-1-0/" class="label_link"></a> <div class="old_price">$40.00</div> <div class="free"> <span class="big">GRATUIT</span> aujourdhui </div> </div> </div> <div class="over"> <div class="giveaway_title"> <a href="https://fr.giveawayoftheday.com/excel-url-validator-1-0/">Excel Url Validator 1.0</a> <div class="giveaway_date">16 octobre 2017</div> </div> <div class="giveaway_descr">Excel Url Validator trouve des liens rompus dans les feuilles de calcul Excel.</div> </div>
Partager