IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

[grep fichier word]recuperer lignes tableau motif


Sujet :

Shell et commandes GNU

  1. #1
    Membre éclairé Avatar de fantomas261
    Inscrit en
    Avril 2007
    Messages
    486
    Détails du profil
    Informations forums :
    Inscription : Avril 2007
    Messages : 486
    Par défaut [grep fichier word]recuperer lignes tableau motif
    bjr,
    j ai un tableau dans un fichier .doc ou il y a une colonne state. je voudrais recuperer les lignes du tableau ou il y a FL dans la colonne state. alors j ecris par exemple grep "FL" fich.doc mais je voudrais les lignes ou il y a FL et non ou il y a un mot composé des deux lettre FL

    exemple :
    1) FLdf
    2) ddgg FL sgfsg
    3)ddFL ddd

    je veux juste la ligne 2)

  2. #2
    Membre émérite
    Avatar de D[r]eadLock
    Profil pro
    Inscrit en
    Mai 2002
    Messages
    504
    Détails du profil
    Informations personnelles :
    Âge : 45
    Localisation : France

    Informations forums :
    Inscription : Mai 2002
    Messages : 504
    Par défaut
    \< (et \>) décrit une barrière (i.e. plus de lettre/chiffre/_ je crois)

  3. #3
    Membre éclairé Avatar de fantomas261
    Inscrit en
    Avril 2007
    Messages
    486
    Détails du profil
    Informations forums :
    Inscription : Avril 2007
    Messages : 486
    Par défaut
    ok j ai teste :
    [julien@localhost commune]$ grep "\<FL\>" H1BSponsorListings06.doc
    Fichier binaire H1BSponsorListings06.doc concorde

    pourquoi j obtiens ce message ? parce que c est un tableau? le fichier est trop volumineux ?

  4. #4
    Membre émérite
    Avatar de D[r]eadLock
    Profil pro
    Inscrit en
    Mai 2002
    Messages
    504
    Détails du profil
    Informations personnelles :
    Âge : 45
    Localisation : France

    Informations forums :
    Inscription : Mai 2002
    Messages : 504
    Par défaut
    Citation Envoyé par leopard261 Voir le message
    Fichier binaire H1BSponsorListings06.doc concorde
    pourquoi j obtiens ce message ?
    Parce que c'est un fichier binaire ! Il contient des caractères non-imprimable. Deux solutions:
    - tu force grep à afficher quand même les lignes (--binary-files=text), tu peux après filtrer
    - tu utilise d'abord strings qui affiche toutes les chaines imprimable (par défaut de taille >= 4 caractères, tu peux changer avec -n), et tu grep dessus (strings -n 2 fichier | grep "\<FL\>")

  5. #5
    Membre émérite Avatar de BlaireauOne
    Profil pro
    Inscrit en
    Mars 2007
    Messages
    492
    Détails du profil
    Informations personnelles :
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Mars 2007
    Messages : 492
    Par défaut
    Autre solution, avant le grep, utiliser antiword

    Description :
    Use this free MS Word reader to convert Word files to text and Postscript format.
    Antiword is a free MS Word reader for Linux, BeOS, and RISC operating systems. It converts files from Word 6/7/97/2000 format to text and Postscript. This update is a maintenance release. It is distributed under the GNU GPL. The download listed here is a gzipped TAR package

  6. #6
    Membre éclairé Avatar de fantomas261
    Inscrit en
    Avril 2007
    Messages
    486
    Détails du profil
    Informations forums :
    Inscription : Avril 2007
    Messages : 486
    Par défaut
    y a un moyen de conserve la structure du tableau ( bordures...)
    en ecrivant strings -n 2 hhih | grep... j ai la colonne state avec FL et c est tout, je voudrais aussi les lignes

  7. #7
    Candidat au Club
    Inscrit en
    Mai 2002
    Messages
    3
    Détails du profil
    Informations forums :
    Inscription : Mai 2002
    Messages : 3
    Par défaut
    essaye ça
    [julien@localhost commune]$ grep -a "\<FL\>" H1BSponsorListings06.doc
    l'option -a oblige grep à traiter le fichier binaire comme un fichier txt

Discussions similaires

  1. [XL-2010] Parser une multitude de fichiers Word dans un tableau Excel
    Par Aerial dans le forum Macros et VBA Excel
    Réponses: 1
    Dernier message: 31/07/2011, 16h45
  2. Inserer un fichier word dans un tableau word
    Par Homer091 dans le forum VBA Word
    Réponses: 2
    Dernier message: 15/05/2008, 18h17
  3. Réponses: 8
    Dernier message: 16/01/2008, 16h15
  4. [JACOB] Lire les lignes d'un fichier Word
    Par djools45 dans le forum Documents
    Réponses: 2
    Dernier message: 25/05/2007, 15h34
  5. Réponses: 3
    Dernier message: 16/12/2005, 15h30

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo