IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

Conversion de texte


Sujet :

Shell et commandes GNU

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Homme Profil pro
    Consultant informatique
    Inscrit en
    Mars 2008
    Messages
    109
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Deux Sèvres (Poitou Charente)

    Informations professionnelles :
    Activité : Consultant informatique

    Informations forums :
    Inscription : Mars 2008
    Messages : 109
    Par défaut Conversion de texte
    Bonjour

    Je voudrais convertir un fichier contenant le texte suivant :

    title=Maison de Convalescence à SAIZY-58190
    Clinique et centre de réadaptation de convalescence construits dans une abbaye du 13ème siècle dans le nord de la Nièvre.

    en du texte lisible par un humain.

    Je suis sous Linux (KSH) est avec les commandes suivante cela ne fait rien :
    iconv -f ISO-8859-1 -t UTF-8 monfichier
    ou
    iconv -f us-ascii -t UTF-8 monfichier

    Comment je peut faire?
    Merci d'avance pour vos réponses

  2. #2
    Rédacteur/Modérateur
    Avatar de Winnt
    Homme Profil pro
    budget et contrôle de gestion
    Inscrit en
    Décembre 2006
    Messages
    1 978
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 57
    Localisation : France

    Informations professionnelles :
    Activité : budget et contrôle de gestion
    Secteur : Administration - Collectivité locale

    Informations forums :
    Inscription : Décembre 2006
    Messages : 1 978
    Par défaut
    Salut,

    Apparemment ton texte est du html.
    Il doit exister un utilitaire permettant la conversion html -> texte.
    Sous réserve, que ma mémoire ne me joue pas de tour, il s'agit dans ton cas de html2txt.
    Winnt
    Merci de lire les règles du forum LaTeX et Qu'est ce qu'un ECM ?.
    N'hésitez pas à parcourir la FAQ la réponse y est peut-être déjà.
    Pensez au bouton si votre problème est résolu.


    C'est en Linuxant qu'on devient .... geek
    Et c'est en LateXant qu'on devient flemmard
    Mon blog tout neuf.
    Articles : présentation de la distribution Gentoo, Les index sous LaTeX et leur personnalisation.

  3. #3
    Membre confirmé
    Homme Profil pro
    Consultant informatique
    Inscrit en
    Mars 2008
    Messages
    109
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Deux Sèvres (Poitou Charente)

    Informations professionnelles :
    Activité : Consultant informatique

    Informations forums :
    Inscription : Mars 2008
    Messages : 109
    Par défaut
    Cette fonction, html2txt, n'existe pas sous linux.

  4. #4
    Membre expérimenté
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Juin 2011
    Messages
    223
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Landes (Aquitaine)

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Juin 2011
    Messages : 223
    Par défaut
    salut,

    Voici plusieurs façons :

    w3m : html→texte convertisseur HTML vers texte avec la commande « w3m -dump »

    html2text : html→texte convertisseur avancé HTML vers texte (ISO 8859-1)

    lynx : convertisseur HTML vers texte avec la commande « lynx -dump »

    elinks : html→texte convertisseur HTML vers texte avec la commande « elinks -dump »

    links : html→texte convertisseur HTML vers texte avec la commande « links -dump »

    links2 : html→texte convertisseur HTML vers texte avec la commande « links2 -dump »

    Après en effet les commandes ne sont pas disponibles par défaut, il faut dans ce cas installer le paquetage avec un "apt-get install nom_du_paquet" ou "yum install nom_du_paquet"

  5. #5
    Membre confirmé
    Homme Profil pro
    Consultant informatique
    Inscrit en
    Mars 2008
    Messages
    109
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Deux Sèvres (Poitou Charente)

    Informations professionnelles :
    Activité : Consultant informatique

    Informations forums :
    Inscription : Mars 2008
    Messages : 109
    Par défaut
    Comme je suis sur une machine de prod je ne peut rien ajouter

  6. #6
    Membre expérimenté
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Juin 2011
    Messages
    223
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Landes (Aquitaine)

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Juin 2011
    Messages : 223
    Par défaut
    Ah oui c'est moche...

    heureusement ce programme existe en perl et ne nécessite pas forcément d'installation/compilation. Il faut en revanche les modules perl installés.

    A tester...

    Voici un lien contenant la source :

    http://cpansearch.perl.org/src/AWRIG...3/html2text.pl

    Copie toute la source et colle la sur le linux dans un fichier ayant comme extension ".pl". Lui donner des droits d'exécution.

    Puis il suffit de l'exécuter en mettant en argument le fichier.
    ça devrait le faire...

  7. #7
    Expert confirmé
    Avatar de becket
    Profil pro
    Informaticien multitâches
    Inscrit en
    Février 2005
    Messages
    2 854
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations professionnelles :
    Activité : Informaticien multitâches
    Secteur : Service public

    Informations forums :
    Inscription : Février 2005
    Messages : 2 854
    Par défaut
    Citation Envoyé par jonas0 Voir le message
    Cette fonction, html2txt, n'existe pas sous linux.
    Ce n'est pas une fonction, c'est un script ou un programme

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    apt-cache search html2text
    html2markdown - convert HTML page into ascii markdown format
    html2text - advanced HTML to text converter
    python-html2text - Python module for converting HTML to Markdown text

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Conversion Word Texte brut
    Par Tunka dans le forum Windows
    Réponses: 5
    Dernier message: 27/05/2006, 10h30
  2. Conversion de text
    Par monsurf dans le forum Access
    Réponses: 8
    Dernier message: 05/05/2006, 16h53
  3. Conversion de texte en image?
    Par sessime dans le forum Langage
    Réponses: 12
    Dernier message: 24/01/2006, 22h04
  4. [VBA] Conversion de texte en formule
    Par preverse dans le forum Macros et VBA Excel
    Réponses: 4
    Dernier message: 05/12/2005, 16h50
  5. Conversion Nombre -> Texte
    Par Isis dans le forum Assembleur
    Réponses: 7
    Dernier message: 04/06/2003, 21h47

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo