Bonjour,
Est il possible en interprétant les balises HTML de lire et d'extraire des données d'un document HTML depuis un fichier vbscript lirehtml.vbs ?
Le fichier html est le code source d'une page web que je souhaite faire interpréter par VBS directement plutôt que repasser par un fichier texte (où est venu s'inscrire le code source de la page web) pour en extraire les données...en effet si les balises ne sont pas reconnues il faut avec le vbs depuis le fichier texte utiliser des split et autres pour pouvoir extraire les data souhaitées identifiées par leur id...
Voici un exemple sous VBA qui marche bien pour extraire les données depuis le fichier textehtml (fichier avec les balises html: h1, span,tr, td...):
et là test_elem pointe directement sur les infos recherchées...
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5 Dim DocumentHTML As Object Dim test_elem As HTMLGenericElement Set DocumentHTML = CreateObject("htmlfile") DocumentHTML.body.innerHTML = textehtml Set test_elem = DocumentHTML.all("price")
en VBS j'arrive à faire interpréter/retravailler ce fichier textehtml mais uniquement sous forme texte sans reconnaissance des balises html, en effet le code suivant ne marche pas (vbs me demande de déclarer body) et en plus pas moyen de déclarer DocumentHTMl as Object et test_elem as HTMLGenericElement?
Merci de votre aide...je parcours le forum mais je ne trouve pas...
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5 code = "Dim DocumentHTML" & vbCrLf code = code & "Dim test_elemHTML" & vbCrLf code = code & vbCrLf & "Set DocumentHTML = CreateObject(""htmlfile"")" code = code & vbCrLf & "DocumentHTML.body.innerHTML = textehtml" 'demande de déclarer body!!! code = code & vbCrLf & "Set test_elem = DocumentHTML.all(""price"")"
Partager