Bonjour,
je souhaite générer un xml à partir d'un fichier html en entrée. Est ce possible?
Je pensais à XHTML->XLST==>XML ??
Merci d'avance.
Bonjour,
je souhaite générer un xml à partir d'un fichier html en entrée. Est ce possible?
Je pensais à XHTML->XLST==>XML ??
Merci d'avance.
Dans cette chaîne de procédé, sans doute, c'est possible et c'est la voie normale: la raison de fondement est précisément xhtml est lui-même déjà un xml proprement formé.Je pensais à XHTML->XLST==>XML ??
Là, c'est le problème. Les fichiers html ne sont pas des documents xml (bien formés). Je trouve l'évolution de html qui persiste à résister la notion de bien formatage au sens de xml peu convainquant. Parfois on invoque le verbiage de formatage de xml comme une raison et là c'est presque insupportable et ridicule. Mais, ça n'engage que moi. La bigoterie est sans doute la raison ... Laissons ... On doit faire face l'état de chose comme telle.je souhaite générer un xml à partir d'un fichier html en entrée. Est ce possible?
Pour faire HTML->XML, on a des libraires et modules que peuvent porter secours. Vous pouvez les rechercher en google selon le langage on travail avec. Les mots de clé souvent fructueuses sont "html cleaner", "html tidy", ... En particulier, en java, vous pouvez regarder JSoup, en python, BeautifulSoup, en javascript/nodejs, JSSoup ... à titre d'exemple seulement. Souvent, le choix est multiple pour chaque langage ... et des heures et des heures perdues avec aussi. Avec ces libraires/modules, d'abord, on élimine d'une façon la plus plausible sans trahi (trop) l'intention de l'original les irrégularités dedans un document html; et puis on transforme le html rendu plus propre, plus standardisé à un xml, sous-entendu bien formé. Et puis, on peut continuer la voie xml->xslt->xml là haut.
Et puis, avec la prolifération d'usage des frameworks, des libraires, de communication sans cesse de client-serveur dans l'écriture de html, le plan au sens large de html->...->xml risque un jour de n'avoir que de sens douteux.
Voilà !
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager