IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

Extraction de texte d'un fichier brut


Sujet :

Shell et commandes GNU

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    6
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2008
    Messages : 6
    Par défaut Extraction de texte d'un fichier brut
    Bonjour,
    je suis un petit nouveau sur ce forum et en programmation, je viens requérir votre aide car je suis dans une impasse :
    Mon problème est le suivant :
    Je récupère un liste de mail (entête, corp ...) dans un fichier texte, après un premier filtre grep j'arrive à élaguer le contenu de ce fichier ainsi qu'à insérer des "balises" afin de repérer le texte à garder.
    je me retrouve donc aven un texte de la forme :

    textextextextetextextextexteDEBUT1adresse_mailFIN1
    textextextextetextextextexteDEBUT2x erreursFIN2
    textextextextetextextextexteDEBUT1adresse_mailFIN1
    textextextextetextextextexteDEBUT2x erreursFIN2
    textextextextetextextextexteDEBUT1adresse_mailFIN1
    textextextextetextextextexteDEBUT2x erreursFIN2
    textextextextetextextextexteDEBUT1adresse_mailFIN1
    textextextextetextextextexteDEBUT2x erreursFIN2

    où x est un nombre variable

    Le but est dans un premier temps de garder uniquement ce qu'il se trouve entre DEBUT1 FIN1 puis entre DEBUT2 FIN2

    Ensuite une fois le tri fait, entre DEBUT2 et FIN2 il se trouve l'expression x erreurs (où x est un nombre), j'aimerai pour finir extraire les ligne + mails associés contenant où erreur différent de 0

    Je penser utiliser awk mais je n'y suis pas arriver si quelqu'un voit une solution ça serai cool !

    Merci par avance
    Nilz

  2. #2
    Membre émérite Avatar de jmelyn
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Septembre 2007
    Messages
    703
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux

    Informations forums :
    Inscription : Septembre 2007
    Messages : 703
    Par défaut
    Bonjour,

    Il est possible de résoudre ce petit problème, mais j'ai l'impression qu'il est nécessaire de prendre un peu de recul afin de remettre en cause certaines manières de faire que tu as utilisées. Par exemple les délimiteurs qui sont 'DEBUT1', 'FIN1', 'DEBUT2', 'FIN2', etc...

    Il serait plus simple de prendre un caractère unique et commun, qui ne se retrouve normalement pas dans les données des champs. Par exemple '@' ou '#' ou encore ':'. Cela dépend de ton environnement. Alors l'utilisation de awk ou d'autres commandes en serait grandement facilitée.

  3. #3
    Membre à l'essai
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    6
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2008
    Messages : 6
    Par défaut
    Je suis d'accord avec toi, c'était pour être plus clair dans mon explication, sinon dans mon script les délimiteurs dont évidemment plus concis !
    Mais bon même avec des délimiteurs plus concis je n'y arrive pas

  4. #4
    Membre émérite Avatar de jmelyn
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Septembre 2007
    Messages
    703
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux

    Informations forums :
    Inscription : Septembre 2007
    Messages : 703
    Par défaut
    Avec les corrections, c'est plus clair. Il serait cependant bon qu'il n'y ait qu'un seul séparateur de champ, disons ':'. Dans ce cas, la commande: cut -d ':' -f 2 est suffisante.

Discussions similaires

  1. [XL-2010] extraction de texte d'un fichier xml
    Par luca.donati dans le forum Macros et VBA Excel
    Réponses: 3
    Dernier message: 18/10/2013, 17h22
  2. [ME10] Extraction de texte d'un fichier
    Par codon21 dans le forum Autres langages
    Réponses: 2
    Dernier message: 04/05/2011, 18h54
  3. Réponses: 8
    Dernier message: 27/04/2008, 15h27
  4. Extraction du text dans un fichier html
    Par projetGTR dans le forum Web
    Réponses: 15
    Dernier message: 20/09/2007, 11h30
  5. Extraction de texte dans un fichier
    Par chris91 dans le forum Langage
    Réponses: 4
    Dernier message: 18/08/2006, 16h09

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo