|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Invité régulier
![]() Étudiant Inscription : avril 2011 Messages : 50 ![]() |
Bonjour,
Je viens de trouver une application pour convertir un fichier HTML en fichier texte. Ma question est la suivante : pourquoi ne suffit-il pas de renommer le fichier ".html" en ".txt" , ce que j'ai toujours fais jusqu'à présent. Y-a-t'il perte de données dans ce dernier type de manipulation? Merci. |
|
|
00
|
|
|
#2 |
|
Membre éprouvé
![]() |
Bonjour,
On ne sait pas à la base ce que fait ton convertisseur, c'est difficile de te répondre. Renommer un fichier .html en .txt revient à afficher la source de la page. |
|
|
10
|
|
|
#3 |
|
Expert Confirmé Sénior
![]() Inscription : septembre 2004 Messages : 5 064 ![]() |
D'habitude, ce qu'on appelle "convertir un fichier HTML en texte", ça implique de virer les balises et de ne garder que ce qu'il y a entre les balises. Remplacer les échappements é par é, aussi.
Éventuellement mettre des sauts de lignes là où il y avait du <br>, du <p> ou autres balises généralement type bloc. Changer l'extension du fichier ne fait rien de tout ça, ça permet juste d'afficher la source HTML de la page en double-cliquant dessus, au lieu que ça démarre un navigateur. |
|
|
10
|
|
|
#4 | |
|
Expert Confirmé
![]() Diem VOVivre Inscription : avril 2006 Messages : 2 644 ![]() |
salut thelvin, Gaetan_ et bienvenu Heka-thumbs,
convertir en fichier texte ne veut pas dire grand chose: html, css, xml... sont des fichiers texte. quand on parle de conversion c'est un changement de format. renommer n'est pas une conversion donc forcement il y aura une différence entre le format d'entrée avec celui de la sortie lors d'une conversion. Citation:
|
|
|
|
10
|
|
|
#5 | |||
|
Invité régulier
![]() Étudiant Inscription : avril 2011 Messages : 50 ![]() |
Citation:
Et bien du coup, je suis allée chercher les caractéristiques de l'application pour savoir si j'en avais besoin. Pour information : "Description HTMLAsText utility converts HTML documents to simple text files, by removing all HTML tags and formatting the text according to your preferences. Features •HTMLAsText automatically removes all tags and scripts from the document. •The remained text is formatted according to the number of characters per line that you select. •All HTML entities (e.g.: &, <) are converted into the corresponding ASCII characters. •Unordered lists (<ul> tag) and ordered lists (<ol> tag) are formatted accordingly. The bullets beside the items of unordered lists are replaced by ASCII characters according to your selection. •Definition lists are formatted by adding spaces in the left side of the definition lines. •Optionally, centered and right-aligned paragraphs are formatted accordingly by adding space characters in the left side of the lines. •Optionally, HTMLAsText allows you to add a line under each heading (<h1> - <h6> tags) •Simple tables can be delimited by spaces, tab characters, commas, or CRLF. •Preformatted text blocks (<pre> tag) are copied "as is", without formatting the text. •You can convert multiple HTML files in the same folder at once, by using wildcard. (e.g.: c:\files\*.html) •You can run the conversion process without displaying any user interface, by using the /run command-line option. " Citation:
Merci, grâce à ta réponse j'ai bien compris la question de l'affichage du fichier .html "sans démarrer le navigateur". D'accord. Voir les fonctions de l'application dans ma réponse à Gaetan, lesquelles confirment tes précisions. Mais du coup, je me pose une autre question : quelle en est l'utilité ? Citation:
En fait, ce que je fais pour le moment est plutôt sommaire (c'est-à-dire-court) et j'avais peur de prendre de mauvaises habitudes pour la suite ou de ne pas me rendre compte de pertes de données. Donc à partir du moment où le fait de changer l'extension du fichier n'interfère pas sur l' intégrité de l'affichage, je vais continuer ainsi. Mais alors du coup, et j'ai également posé cette question à thelvin, à quoi sert cette application ? Qui l'utilise ? |
|||
|
|
00
|
|
|
#6 |
|
Expert Confirmé
![]() Diem VOVivre Inscription : avril 2006 Messages : 2 644 ![]() |
perso, en dehors de l'utilisateur lambda qui voudrait automatiser l'extraction de donnée d'une page html je vois pas trop... parce que les développeurs trouverons plus utiles d'avoir des balises pour les extraire.
après l'utilité d'extraire les données bruts plutot que le html ca pourrait être d'un point de vu sécurité: filtrer un contenu sans ses scripts et autre, pour par exemple le remettre dans une autre page html... enfin... toujours un palliatif pour celui qui n'est pas développeur. |
|
|
10
|
|
|
#7 | |
|
Invité régulier
![]() Étudiant Inscription : avril 2011 Messages : 50 ![]() |
Citation:
|
|
|
|
00
|
Copyright © 2000-2012 - www.developpez.com