IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

HTML Discussion :

Convertisseur HTML vers Texte, ôtez-moi un doute.


Sujet :

HTML

  1. #1
    Membre confirmé
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2011
    Messages
    100
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Avril 2011
    Messages : 100
    Par défaut Convertisseur HTML vers Texte, ôtez-moi un doute.
    Bonjour,

    Je viens de trouver une application pour convertir un fichier HTML en fichier texte. Ma question est la suivante : pourquoi ne suffit-il pas de renommer le fichier ".html" en ".txt" , ce que j'ai toujours fais jusqu'à présent. Y-a-t'il perte de données dans ce dernier type de manipulation?
    Merci.

  2. #2
    Membre chevronné
    Homme Profil pro
    Webmaster
    Inscrit en
    Janvier 2007
    Messages
    489
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France

    Informations professionnelles :
    Activité : Webmaster
    Secteur : Biens de consommation

    Informations forums :
    Inscription : Janvier 2007
    Messages : 489
    Par défaut
    Bonjour,

    On ne sait pas à la base ce que fait ton convertisseur, c'est difficile de te répondre.

    Renommer un fichier .html en .txt revient à afficher la source de la page.

  3. #3
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 582
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 582
    Par défaut
    D'habitude, ce qu'on appelle "convertir un fichier HTML en texte", ça implique de virer les balises et de ne garder que ce qu'il y a entre les balises. Remplacer les échappements é par é, aussi.
    Éventuellement mettre des sauts de lignes là où il y avait du <br>, du <p> ou autres balises généralement type bloc.

    Changer l'extension du fichier ne fait rien de tout ça, ça permet juste d'afficher la source HTML de la page en double-cliquant dessus, au lieu que ça démarre un navigateur.
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  4. #4
    Expert confirmé
    Avatar de vodiem
    Homme Profil pro
    Vivre
    Inscrit en
    Avril 2006
    Messages
    2 895
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Vivre
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2006
    Messages : 2 895
    Par défaut
    salut thelvin, Gaetan_ et bienvenu Heka-thumbs,

    convertir en fichier texte ne veut pas dire grand chose: html, css, xml... sont des fichiers texte. quand on parle de conversion c'est un changement de format. renommer n'est pas une conversion donc forcement il y aura une différence entre le format d'entrée avec celui de la sortie lors d'une conversion.

    Citation Envoyé par Heka-thumbs
    pourquoi ne suffit-il pas de renommer le fichier ".html" en ".txt" , ce que j'ai toujours fais jusqu'à présent
    si renommer te convenait pour ton usage autant changer l'association du fichier.

  5. #5
    Membre confirmé
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2011
    Messages
    100
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Avril 2011
    Messages : 100
    Par défaut
    Citation Envoyé par Gaetan_ Voir le message
    Bonjour,

    On ne sait pas à la base ce que fait ton convertisseur, c'est difficile de te répondre.

    Renommer un fichier .html en .txt revient à afficher la source de la page.
    Bonjour Gaétan,

    Et bien du coup, je suis allée chercher les caractéristiques de l'application pour savoir si j'en avais besoin. Pour information :

    "Description

    HTMLAsText utility converts HTML documents to simple text files, by removing all HTML tags and formatting the text according to your preferences.

    Features

    •HTMLAsText automatically removes all tags and scripts from the document.
    •The remained text is formatted according to the number of characters per line that you select.
    •All HTML entities (e.g.: &amp, &lt) are converted into the corresponding ASCII characters.
    •Unordered lists (<ul> tag) and ordered lists (<ol> tag) are formatted accordingly. The bullets beside the items of unordered lists are replaced by ASCII characters according to your selection.
    •Definition lists are formatted by adding spaces in the left side of the definition lines.
    •Optionally, centered and right-aligned paragraphs are formatted accordingly by adding space characters in the left side of the lines.
    •Optionally, HTMLAsText allows you to add a line under each heading (<h1> - <h6> tags)
    •Simple tables can be delimited by spaces, tab characters, commas, or CRLF.
    •Preformatted text blocks (<pre> tag) are copied "as is", without formatting the text.
    •You can convert multiple HTML files in the same folder at once, by using wildcard. (e.g.: c:\files\*.html)
    •You can run the conversion process without displaying any user interface, by using the /run command-line option.
    "

    Citation Envoyé par thelvin Voir le message
    D'habitude, ce qu'on appelle "convertir un fichier HTML en texte", ça implique de virer les balises et de ne garder que ce qu'il y a entre les balises. Remplacer les échappements &eacute; par é, aussi.
    Éventuellement mettre des sauts de lignes là où il y avait du <br>, du <p> ou autres balises généralement type bloc.

    Changer l'extension du fichier ne fait rien de tout ça, ça permet juste d'afficher la source HTML de la page en double-cliquant dessus, au lieu que ça démarre un navigateur.
    Bonjour thelvin,

    Merci, grâce à ta réponse j'ai bien compris la question de l'affichage du fichier .html "sans démarrer le navigateur".

    D'accord. Voir les fonctions de l'application dans ma réponse à Gaetan, lesquelles confirment tes précisions. Mais du coup, je me pose une autre question : quelle en est l'utilité ?

    Citation Envoyé par vodiem Voir le message
    salut thelvin, Gaetan_ et bienvenu Heka-thumbs,

    convertir en fichier texte ne veut pas dire grand chose: html, css, xml... sont des fichiers texte. quand on parle de conversion c'est un changement de format. renommer n'est pas une conversion donc forcement il y aura une différence entre le format d'entrée avec celui de la sortie lors d'une conversion.


    si renommer te convenait pour ton usage autant changer l'association du fichier.
    Bonjour vodiem et merci,

    En fait, ce que je fais pour le moment est plutôt sommaire (c'est-à-dire-court) et j'avais peur de prendre de mauvaises habitudes pour la suite ou de ne pas me rendre compte de pertes de données. Donc à partir du moment où le fait de changer l'extension du fichier n'interfère pas sur l' intégrité de l'affichage, je vais continuer ainsi.

    Mais alors du coup, et j'ai également posé cette question à thelvin, à quoi sert cette application ? Qui l'utilise ?

  6. #6
    Expert confirmé
    Avatar de vodiem
    Homme Profil pro
    Vivre
    Inscrit en
    Avril 2006
    Messages
    2 895
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Vivre
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2006
    Messages : 2 895
    Par défaut
    perso, en dehors de l'utilisateur lambda qui voudrait automatiser l'extraction de donnée d'une page html je vois pas trop... parce que les développeurs trouverons plus utiles d'avoir des balises pour les extraire.
    après l'utilité d'extraire les données bruts plutot que le html ca pourrait être d'un point de vu sécurité: filtrer un contenu sans ses scripts et autre, pour par exemple le remettre dans une autre page html...
    enfin... toujours un palliatif pour celui qui n'est pas développeur.


  7. #7
    Membre confirmé
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2011
    Messages
    100
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Avril 2011
    Messages : 100
    Par défaut
    Citation Envoyé par vodiem Voir le message
    perso, en dehors de l'utilisateur lambda qui voudrait automatiser l'extraction de donnée d'une page html je vois pas trop... parce que les développeurs trouverons plus utiles d'avoir des balises pour les extraire.
    après l'utilité d'extraire les données bruts plutot que le html ca pourrait être d'un point de vu sécurité: filtrer un contenu sans ses scripts et autre, pour par exemple le remettre dans une autre page html...
    enfin... toujours un palliatif pour celui qui n'est pas développeur.

    D'accord. Et bien merci pour toutes ces précisions qui m'ont permises d'y voir plus clair et de déterminer si j'avais une quelconque utilité de ce soft. J'attends encore un peu et je mettrai que cette question est résolue.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [WD15] Extraction texte d'une page html vers table windev
    Par bouscape dans le forum WinDev
    Réponses: 4
    Dernier message: 19/01/2012, 16h09
  2. convertisseur html texte
    Par olivier1209 dans le forum Langage
    Réponses: 6
    Dernier message: 07/03/2010, 12h52
  3. HTML vers TEXTE sans balises
    Par belocom dans le forum VB.NET
    Réponses: 9
    Dernier message: 04/02/2007, 19h16
  4. [WD9] Html vers Texte
    Par Romanops dans le forum WinDev
    Réponses: 6
    Dernier message: 20/04/2006, 15h40
  5. Réponses: 6
    Dernier message: 28/05/2004, 19h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo