Bonjour,

Est il possible en interprétant les balises HTML de lire et d'extraire des données d'un document HTML depuis un fichier vbscript lirehtml.vbs ?
Le fichier html est le code source d'une page web que je souhaite faire interpréter par VBS directement plutôt que repasser par un fichier texte (où est venu s'inscrire le code source de la page web) pour en extraire les données...en effet si les balises ne sont pas reconnues il faut avec le vbs depuis le fichier texte utiliser des split et autres pour pouvoir extraire les data souhaitées identifiées par leur id...

Voici un exemple sous VBA qui marche bien pour extraire les données depuis le fichier textehtml (fichier avec les balises html: h1, span,tr, td...):
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
Dim DocumentHTML As Object
Dim test_elem As HTMLGenericElement
Set DocumentHTML = CreateObject("htmlfile")
DocumentHTML.body.innerHTML = textehtml
Set test_elem = DocumentHTML.all("price")
et là test_elem pointe directement sur les infos recherchées...

en VBS j'arrive à faire interpréter/retravailler ce fichier textehtml mais uniquement sous forme texte sans reconnaissance des balises html, en effet le code suivant ne marche pas (vbs me demande de déclarer body) et en plus pas moyen de déclarer DocumentHTMl as Object et test_elem as HTMLGenericElement?

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
code = "Dim DocumentHTML" & vbCrLf
code = code & "Dim test_elemHTML" & vbCrLf
code = code & vbCrLf & "Set DocumentHTML = CreateObject(""htmlfile"")"
code = code & vbCrLf & "DocumentHTML.body.innerHTML = textehtml" 'demande de déclarer body!!!
code = code & vbCrLf & "Set test_elem = DocumentHTML.all(""price"")"
Merci de votre aide...je parcours le forum mais je ne trouve pas...