Précédent   Forum des professionnels en informatique > Webmasters - Développement Web > HTML / DHTML / XHTML
HTML / DHTML / XHTML Forum sur la programmation HTML / DHTML/ XHTML et la validation W3C. Cours (X)HTML, FAQ (X)HTML
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 06/04/2011, 04h56   #1
Invité régulier
 
Femme
Étudiant
Inscription : avril 2011
Messages : 50
Détails du profil
Informations personnelles :
Sexe : Femme
Localisation : France

Informations professionnelles :
Activité : Étudiant
Secteur : Enseignement

Informations forums :
Inscription : avril 2011
Messages : 50
Points : 5
Points : 5
Par défaut Convertisseur HTML vers Texte, ôtez-moi un doute.

Bonjour,

Je viens de trouver une application pour convertir un fichier HTML en fichier texte. Ma question est la suivante : pourquoi ne suffit-il pas de renommer le fichier ".html" en ".txt" , ce que j'ai toujours fais jusqu'à présent. Y-a-t'il perte de données dans ce dernier type de manipulation?
Merci.
Heka-thumbs est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 06/04/2011, 10h36   #2
Membre éprouvé
 
Homme Gaetan
Webmaster
Inscription : janvier 2007
Messages : 386
Détails du profil
Informations personnelles :
Nom : Homme Gaetan
Âge : 40
Localisation : France

Informations professionnelles :
Activité : Webmaster
Secteur : Biens de consommation

Informations forums :
Inscription : janvier 2007
Messages : 386
Points : 441
Points : 441
Envoyer un message via MSN à Gaetan_
Bonjour,

On ne sait pas à la base ce que fait ton convertisseur, c'est difficile de te répondre.

Renommer un fichier .html en .txt revient à afficher la source de la page.
Gaetan_ est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 06/04/2011, 11h01   #3
Expert Confirmé Sénior
 
Inscription : septembre 2004
Messages : 5 064
Détails du profil
Informations forums :
Inscription : septembre 2004
Messages : 5 064
Points : 6 981
Points : 6 981
D'habitude, ce qu'on appelle "convertir un fichier HTML en texte", ça implique de virer les balises et de ne garder que ce qu'il y a entre les balises. Remplacer les échappements é par é, aussi.
Éventuellement mettre des sauts de lignes là où il y avait du <br>, du <p> ou autres balises généralement type bloc.

Changer l'extension du fichier ne fait rien de tout ça, ça permet juste d'afficher la source HTML de la page en double-cliquant dessus, au lieu que ça démarre un navigateur.
thelvin est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 07/04/2011, 11h58   #4
Expert Confirmé
 
Avatar de vodiem
 
Homme Diem VO
Vivre
Inscription : avril 2006
Messages : 2 644
Détails du profil
Informations personnelles :
Nom : Homme Diem VO
Âge : 40
Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

Informations professionnelles :
Activité : Vivre
Secteur : Conseil

Informations forums :
Inscription : avril 2006
Messages : 2 644
Points : 3 895
Points : 3 895
salut thelvin, Gaetan_ et bienvenu Heka-thumbs,

convertir en fichier texte ne veut pas dire grand chose: html, css, xml... sont des fichiers texte. quand on parle de conversion c'est un changement de format. renommer n'est pas une conversion donc forcement il y aura une différence entre le format d'entrée avec celui de la sortie lors d'une conversion.

Citation:
Envoyé par Heka-thumbs
pourquoi ne suffit-il pas de renommer le fichier ".html" en ".txt" , ce que j'ai toujours fais jusqu'à présent
si renommer te convenait pour ton usage autant changer l'association du fichier.
vodiem est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 11/04/2011, 03h01   #5
Invité régulier
 
Femme
Étudiant
Inscription : avril 2011
Messages : 50
Détails du profil
Informations personnelles :
Sexe : Femme
Localisation : France

Informations professionnelles :
Activité : Étudiant
Secteur : Enseignement

Informations forums :
Inscription : avril 2011
Messages : 50
Points : 5
Points : 5
Citation:
Envoyé par Gaetan_ Voir le message
Bonjour,

On ne sait pas à la base ce que fait ton convertisseur, c'est difficile de te répondre.

Renommer un fichier .html en .txt revient à afficher la source de la page.
Bonjour Gaétan,

Et bien du coup, je suis allée chercher les caractéristiques de l'application pour savoir si j'en avais besoin. Pour information :

"Description

HTMLAsText utility converts HTML documents to simple text files, by removing all HTML tags and formatting the text according to your preferences.

Features

•HTMLAsText automatically removes all tags and scripts from the document.
•The remained text is formatted according to the number of characters per line that you select.
•All HTML entities (e.g.: &amp, &lt) are converted into the corresponding ASCII characters.
•Unordered lists (<ul> tag) and ordered lists (<ol> tag) are formatted accordingly. The bullets beside the items of unordered lists are replaced by ASCII characters according to your selection.
•Definition lists are formatted by adding spaces in the left side of the definition lines.
•Optionally, centered and right-aligned paragraphs are formatted accordingly by adding space characters in the left side of the lines.
•Optionally, HTMLAsText allows you to add a line under each heading (<h1> - <h6> tags)
•Simple tables can be delimited by spaces, tab characters, commas, or CRLF.
•Preformatted text blocks (<pre> tag) are copied "as is", without formatting the text.
•You can convert multiple HTML files in the same folder at once, by using wildcard. (e.g.: c:\files\*.html)
•You can run the conversion process without displaying any user interface, by using the /run command-line option.
"

Citation:
Envoyé par thelvin Voir le message
D'habitude, ce qu'on appelle "convertir un fichier HTML en texte", ça implique de virer les balises et de ne garder que ce qu'il y a entre les balises. Remplacer les échappements &eacute; par é, aussi.
Éventuellement mettre des sauts de lignes là où il y avait du <br>, du <p> ou autres balises généralement type bloc.

Changer l'extension du fichier ne fait rien de tout ça, ça permet juste d'afficher la source HTML de la page en double-cliquant dessus, au lieu que ça démarre un navigateur.
Bonjour thelvin,

Merci, grâce à ta réponse j'ai bien compris la question de l'affichage du fichier .html "sans démarrer le navigateur".

D'accord. Voir les fonctions de l'application dans ma réponse à Gaetan, lesquelles confirment tes précisions. Mais du coup, je me pose une autre question : quelle en est l'utilité ?

Citation:
Envoyé par vodiem Voir le message
salut thelvin, Gaetan_ et bienvenu Heka-thumbs,

convertir en fichier texte ne veut pas dire grand chose: html, css, xml... sont des fichiers texte. quand on parle de conversion c'est un changement de format. renommer n'est pas une conversion donc forcement il y aura une différence entre le format d'entrée avec celui de la sortie lors d'une conversion.


si renommer te convenait pour ton usage autant changer l'association du fichier.
Bonjour vodiem et merci,

En fait, ce que je fais pour le moment est plutôt sommaire (c'est-à-dire-court) et j'avais peur de prendre de mauvaises habitudes pour la suite ou de ne pas me rendre compte de pertes de données. Donc à partir du moment où le fait de changer l'extension du fichier n'interfère pas sur l' intégrité de l'affichage, je vais continuer ainsi.

Mais alors du coup, et j'ai également posé cette question à thelvin, à quoi sert cette application ? Qui l'utilise ?
Heka-thumbs est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/04/2011, 04h15   #6
Expert Confirmé
 
Avatar de vodiem
 
Homme Diem VO
Vivre
Inscription : avril 2006
Messages : 2 644
Détails du profil
Informations personnelles :
Nom : Homme Diem VO
Âge : 40
Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

Informations professionnelles :
Activité : Vivre
Secteur : Conseil

Informations forums :
Inscription : avril 2006
Messages : 2 644
Points : 3 895
Points : 3 895
perso, en dehors de l'utilisateur lambda qui voudrait automatiser l'extraction de donnée d'une page html je vois pas trop... parce que les développeurs trouverons plus utiles d'avoir des balises pour les extraire.
après l'utilité d'extraire les données bruts plutot que le html ca pourrait être d'un point de vu sécurité: filtrer un contenu sans ses scripts et autre, pour par exemple le remettre dans une autre page html...
enfin... toujours un palliatif pour celui qui n'est pas développeur.

vodiem est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 12/04/2011, 01h09   #7
Invité régulier
 
Femme
Étudiant
Inscription : avril 2011
Messages : 50
Détails du profil
Informations personnelles :
Sexe : Femme
Localisation : France

Informations professionnelles :
Activité : Étudiant
Secteur : Enseignement

Informations forums :
Inscription : avril 2011
Messages : 50
Points : 5
Points : 5
Citation:
Envoyé par vodiem Voir le message
perso, en dehors de l'utilisateur lambda qui voudrait automatiser l'extraction de donnée d'une page html je vois pas trop... parce que les développeurs trouverons plus utiles d'avoir des balises pour les extraire.
après l'utilité d'extraire les données bruts plutot que le html ca pourrait être d'un point de vu sécurité: filtrer un contenu sans ses scripts et autre, pour par exemple le remettre dans une autre page html...
enfin... toujours un palliatif pour celui qui n'est pas développeur.

D'accord. Et bien merci pour toutes ces précisions qui m'ont permises d'y voir plus clair et de déterminer si j'avais une quelconque utilité de ce soft. J'attends encore un peu et je mettrai que cette question est résolue.
Heka-thumbs est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 02h02.


 
 
 
 
Partenaires

Hébergement Web