IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

[sed] Extraction d'une portion de fichier débutant par


Sujet :

Shell et commandes GNU

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Février 2011
    Messages
    56
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2011
    Messages : 56
    Par défaut [sed] Extraction d'une portion de fichier débutant par
    Bonjour,

    Je dispose d'un fichier binaire dont j'aimerais récupérer une sous partie, débutant par une ligne bien précise et terminant par une autre.

    Jusqu'à présent pas de problème.

    Par exemple, si je veux extraire la sous partie débutant par 3HKP0000Y et se terminant par EOF :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -n "/^3HKP0000Y/,/EOF/p" ../Monfichierbinaire
    ça fonctionne.

    Par contre si je veux compliquer la chose, en précisant :
    je veux extraire la sous partie débutant par la ligne : "commençant par 3HKP0000Y et contenant Version"
    et se terminant toujours par EOF :

    Si je fais :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -n "/^3HKP0000Y\(.*\)Version\(.*\)/,/EOF/p" ../Monfichierbinaire
    par exemple, cela ne fonctionne pas.

    Pour info, voici un aperçu de la ligne que je recherche dans le fichier :



    Merci d'avance pour votre aide

    Thomas

  2. #2
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 650
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 650
    Par défaut
    Bonjour,

    Citation Envoyé par thomas.m
    Par exemple, si je veux extraire la sous partie débutant par 3HKP0000Y et se terminant par EOF :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -n "/^3HKP0000Y/EOF/p" ../Monfichierbinaire
    ça fonctionne.
    c'est bizarre, ça ne devrait pas
    la barre oblique est le séparateur de commandes de sed, si elle apparaît dans le motif, alors il faut la protéger pour que sed ne confonde pas.

    Si je fais :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -n "/^3HKP0000Y\(.*\)Version\(.*\)/EOF/p" ../Monfichierbinaire
    par exemple, cela ne fonctionne pas.
    pourquoi mettre .* entre parenthèses ?


    quelle étrange idée de s'embêter à capturer une image, au lieu de faire un copier-coller dans une balise code ?
    c'est pas très pratique pour nous : il faut qu'on se tape la recopie de l'extrait à la main pour faire des tests
    N'oubliez pas de consulter les cours shell, la FAQ, et les pages man.

  3. #3
    Expert confirmé Avatar de Flodelarab
    Homme Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente (Poitou Charente)

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5 287
    Par défaut
    L'exemple est d'autant plus étrange qu'aucune ligne ne commence par 3HKP0000Y, continue avec Version et finit par EOF.


    Sinon, pour être constructif, je dirais qu'on n'est pas obligé de tout faire d'un coup. Et je propose cette solution (en 3 instructions, donc):

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed '/^3HKP0000Y/!d;/Version/!d;/EOF$/!d' ../Monfichierbinaire
    En français, ça donne: "Supprimer les lignes qui ne commencent pas par ... ne contiennent pas ... et ne finissent pas par..."


    Si tu veux travailler uniquement sur la dernière ligne de ton fichier (Ce que suggère EOF (end of file) ) le sigle $ est bon pour toi:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed '$!d;/^3HKP0000Y/!d;/Version/!d' ../Monfichierbinaire

  4. #4
    Expert confirmé

    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    1 946
    Détails du profil
    Informations personnelles :
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Janvier 2011
    Messages : 1 946
    Par défaut
    Salut,

    Citation Envoyé par Flodelarab Voir le message
    Sinon, pour être constructif, je dirais qu'on n'est pas obligé de tout faire d'un coup. Et je propose cette solution (en 3 instructions, donc):
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed '/^3HKP0000Y/!d;/Version/!d;/EOF$/!d' ../Monfichierbinaire
    En français, ça donne: "Supprimer les lignes qui ne commencent pas par ... ne contiennent pas ... et ne finissent pas par..."
    Ce qui pourrait se réduire à :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed '/^3HKP0000Y\|Version\|EOF$/!d' ../Monfichierbinaire
    En français, ça donnerait : "Supprimer les lignes qui ne commencent pas par ... OU ne contiennent pas ... OU et ne finissent pas par..."


  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Février 2011
    Messages
    56
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2011
    Messages : 56
    Par défaut
    Bonjour,

    Merci à tous pour vos réponses.

    Citation Envoyé par N_BaH Voir le message
    c'est bizarre, ça ne devrait pas
    la barre oblique est le séparateur de commandes de sed, si elle apparaît dans le motif, alors il faut la protéger pour que sed ne confonde pas.
    J'utilise la commande sed pour extraire tout ce qui se trouve entre le premier match de la commande et le deuxième match : sed -n "/MATCH1/MATCH2/p".
    Est ce que je me trompe dans la commande ? je ne suis pas un expert en sed et regex, en tout cas cette synthaxe fonctionne pour d'autres applications.

    Citation Envoyé par N_BaH Voir le message
    pourquoi mettre .* entre parenthèses ?
    Je ne sais pas, je vais essayer sans

    Citation Envoyé par N_BaH Voir le message
    quelle étrange idée de s'embêter à capturer une image, au lieu de faire un copier-coller dans une balise code ?
    c'est pas très pratique pour nous : il faut qu'on se tape la recopie de l'extrait à la main pour faire des tests
    En fait, vu qu'il s'agit de caractères "null" issus d'un fichier binaire, lorsque je copie colle sur le forum, tous les caractères spéciaux sont convertis en espace blanc ... pas très parlant ! Je voulais que vous visualisiez ce que j'ai à l'écran.

    Citation Envoyé par Flodelarab Voir le message
    L'exemple est d'autant plus étrange qu'aucune ligne ne commence par 3HKP0000Y, continue avec Version et finit par EOF.
    Je me suis peu être mal exprimé. Je cherche à récupérer tout ce qui se trouve entre 2 lignes.
    La première ligne : doit commencer par 3HKP0000Y par exemple, et contenir version. entre les deux se trouvent des caractères binaires illisibles.
    La deuxième ligne : = EOF

    Je vais tester vos différentes propositions dès ce soir et je vous tiens au courant, mais il va falloir que j'adapte ça pour bien récupérer tout ce qu'il y a entre les deux.

    En gros il faudrait trouver une regex qui arrive à matcher la ligne qui débute par 3HKP0000Y et qui contient "Version" dans le screenshot joint.

    Merci en tout cas pour votre aide

  6. #6
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 650
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 650
    Par défaut
    Citation Envoyé par thomas.m
    vu qu'il s'agit de caractères "null" issus d'un fichier binaire[...]
    effectivement

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed '/^3HKP0000Y.*Version/!d' fichier
    pour être plus précis / est le séparateur d'expression par défaut; le séparateur de commandes c'est ;.
    N'oubliez pas de consulter les cours shell, la FAQ, et les pages man.

  7. #7
    Expert confirmé Avatar de Flodelarab
    Homme Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente (Poitou Charente)

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5 287
    Par défaut
    Citation Envoyé par zipe31 Voir le message
    Ce qui pourrait se réduire à :
    La tentative de prendre les problèmes un par un n'aura pas duré longtemps
    Citation Envoyé par zipe31 Voir le message
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed '/^3HKP0000Y\|Version\|EOF$/!d' ../Monfichierbinaire
    En français, ça donnerait : "Supprimer les lignes qui ne commencent pas par ... OU ne contiennent pas ... OU et ne finissent pas par..."

    Et bien non. Dans ton script, il suffit que la ligne contienne l'un des trois pour ne pas être détruite. Dans mon script, l'absence de l'un des trois fusille la ligne.



    mais, à ce compte, tu pourrais aussi bien utiliser grep :
    Sauf s'il veut détecter la fin de fichier. Auquel cas, je maintiens le deuxième script.

    A ce propos, je rappelle qu'il ne faut pas confondre
    • $ qui signifie la fin de ligne dans une expression régulière (regex)
    • $ qui signifie la dernière ligne du fichier dans l'adressage sed

  8. #8
    Expert confirmé

    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    1 946
    Détails du profil
    Informations personnelles :
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Janvier 2011
    Messages : 1 946
    Par défaut
    Citation Envoyé par Flodelarab Voir le message
    La tentative de prendre les problèmes un par un n'aura pas duré longtempsEt bien non. Dans ton script, il suffit que la ligne contienne l'un des trois pour ne pas être détruite. Dans mon script, l'absence de l'un des trois fusille la ligne
    Exact, toutes mes plates de ce fait.

    Pour une fois que je ne teste pas

    A ma décharge je n'avais pas bien fait attention à la négation, qui dans ce cas fait bien foirer ma syntaxe.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [sed] Extraction d'une chaine
    Par cubepiege dans le forum Shell et commandes GNU
    Réponses: 5
    Dernier message: 30/03/2015, 14h06
  2. [CS5] Lire un fichier son à partir d'une portion de fichier audio
    Par Jean-Pascal dans le forum ActionScript 3
    Réponses: 0
    Dernier message: 11/05/2012, 17h01
  3. [RegEx] Extraction d'une portion de chaîne dans une url
    Par Torgar dans le forum Langage
    Réponses: 12
    Dernier message: 09/12/2011, 16h33
  4. Sed:extraction d'une ligne spécifque
    Par Badour_ dans le forum Linux
    Réponses: 7
    Dernier message: 15/01/2010, 19h24
  5. Réponses: 3
    Dernier message: 03/09/2007, 15h07

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo