Bonjour,
Je cherche un composant permettant de "parser" des documents HTML à la façon de SimpleHtmlParser pour PHP (http://simplehtmldom.sourceforge.net/), est-ce que quelqu'un connaît ça ?
Merci.
Bonjour,
Je cherche un composant permettant de "parser" des documents HTML à la façon de SimpleHtmlParser pour PHP (http://simplehtmldom.sourceforge.net/), est-ce que quelqu'un connaît ça ?
Merci.
Tu as l'interface IHTMLDocument2 accessible depuis un TWebBrowser.Document !
Cela utilise les interfaces internes de IE !
Aide via F1 - FAQ - Guide du développeur Delphi devant un problème - Pensez-y !![]()
Attention Troll Méchant !
"Quand un homme a faim, mieux vaut lui apprendre à pêcher que de lui donner un poisson" Confucius
Mieux vaut se taire et paraître idiot, Que l'ouvrir et de le confirmer !
L'ignorance n'excuse pas la médiocrité !
L'expérience, c'est le nom que chacun donne à ses erreurs. (Oscar Wilde)
Il faut avoir le courage de se tromper et d'apprendre de ses erreurs
Bonjour,
regarde ce projet, ça pourrait t'interesser je pense :
http://sourceforge.net/projects/htmlp/
@++
Dany
Mon Tutoriel sur le développement Intraweb
N'oubliez pas de consulter les FAQ Delphi ainsi que les Cours et tutoriels sur la programmation Delphi
Merci à tous 2.
@ShaiLeTroll: j'ai fouillé le web de fonds en combles, je n'ai pratiquement rien trouvé sur le sujet, je préfère faire l'impasse :-\
@skywaukers: j'avais déjà téléchargé ce projet mais il n'y a aucune doc et aucun commentaire dans le code; et comme c'est assez touffu (pour moi)... :-\
Le truc que j'ai trouvé qui se rapproche le plus, c'est "InternetTools" (il faut que je retrouve l'adresse du site) mais hélas c'est pour FreePascal/Lazarus donc même si ça marche il risque d'y avoir pas mal d'adaptations à faire (et je suis fainéant).
Refouille encore !
[D7]IHtmlDocument --> WebBrowser : un basique a étudier ! Surtout l'utilisation de IHTMLElementCollection
utilise MSHTML_TLB.pas cela contient l'importe de MSHTML.TLB
théoriquement dans "Borland\Delphi6\Source\Internet" ou "CodeGear\BDS\5.0\source\Win32\internet"
Rien qu'avec toutes ces déclarations, ça donne de quoi fouiller !
Enfin le cérise sur le gateau
MSDN IHTMLDocument2 Interface and Object, c'est indiqué .NET mais c'est la même chose puisque c'est un Objet OLE intégré à IE !
Pour le THtmlParser, en même temps, c'est assez simple d'utilisation à la lecture du code, c'est un arbre de TElement (TNode.childNodes ... récursivité)
C'est la même chose que le TXMLDocument !
Un basique lorsqu'on le connait le bien XML et sa nature à être représenté sur la forme d'une arborsence d'objets noeuds polymorphes !
Allez GoustiFruit presse toi un peu le jus (ça donne quoi le jus de pain de singe ?), ça devrait allez !
Utilise un coup-chou pour ton baobab dans la main !
Aide via F1 - FAQ - Guide du développeur Delphi devant un problème - Pensez-y !![]()
Attention Troll Méchant !
"Quand un homme a faim, mieux vaut lui apprendre à pêcher que de lui donner un poisson" Confucius
Mieux vaut se taire et paraître idiot, Que l'ouvrir et de le confirmer !
L'ignorance n'excuse pas la médiocrité !
L'expérience, c'est le nom que chacun donne à ses erreurs. (Oscar Wilde)
Il faut avoir le courage de se tromper et d'apprendre de ses erreurs
Bon là j'avoue que je n'ai pas compris
Sinon - aurais-je oublié de le préciser ? - ce que je recherche avant tout c'est la possibilité de travailler sur des "sélections" dans mon code html en passant par des requêtes de type XPath, et d'après ce que j'ai cru comprendre (?) en parcourant le net, le bidule MsHtml ne le permet pas (? idem pour le THMLParser !?)... Ou au mieux ça "marchouille" sur le xml mais pas sur le html ?
C'est quand même ballot que ce soit si simple en PHP et si introuvable en pascal![]()
Partager