IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

Sed extraire une sous-chaine lettre de lecteur


Sujet :

Shell et commandes GNU

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Profil pro
    Inscrit en
    Mars 2006
    Messages
    165
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2006
    Messages : 165
    Par défaut Sed extraire une sous-chaine lettre de lecteur
    Bonjour,

    encore une question avec sed. Je cherche à extraire, dans un fichier, toutes les chaines de caractère commençant par une lettre de lecteur (C, D, E, c, d...) et terminant les lignes :

    Exemple du fichier :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    fichier:vbs 10ko script C:\windows\script vbs.vbs
    Dossier:répertoire 400Mo ; f:\Dossier
    chaine de caractères quelconque
    texte sans intérêt 
    Nouveau dossier - fichier / répertoire. C:\f.bat
    D:\fichier.txt
    ...
    Il n'y a pas spécialement d'éléments permanents si ce n'est que le chemin des fichiers/dossiers termine les lignes.

    Résultat attendu :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    C:\windows\script vbs.vbs
    f:\Dossier
    C:\f.bat
    D:\fichier.txt
    Ca m'énerve vachement de ne pas trouver d'autant que j'ai retourné toutes les pages sur sed (motifs, sous-chaines...) et qu'en plus BlaireauOne m'avait donné une solution pour une question assez similaire mais dont la commande ne semble pas marcher dans ce cas...

    Donc une lettre de lecteur sera le début de la chaine à extraire [a-zA-Z], et elle sera toujours suivie de l'expression :\ soit :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    extraire toutes les parties de droite des chaines du ffichier commençant par [a-zA-Z]:\
    voilà ça c'est le papier, maintenant en pratique ça ne va pas du tout. J'ai essayé un tas de combinaisons qui ne renvoient pour la plupart aucun résultat (pas de message d'erreur), en voici une :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -n '/ [a-zA-Z]:\\*$/s/^.*\( [a-zA-Z]:\\*$\)/\1/p'
    A noter que j'ai inclus un espace avant la lettre de lecteur dans cet exemple, mais ce n'est pas forcément toujours le cas. Qu'est-ce qui ne va pas, et où pourrais-je trouver un cours qui détaille bien ce type d'extraction ?

    Ce n'est pas tant la commande exacte qui m'intéresse mais surtout le cheminement pour mettre en forme cette recherche

    Merci

  2. #2
    Membre chevronné
    Avatar de Schmorgluck
    Profil pro
    Inscrit en
    Mai 2006
    Messages
    371
    Détails du profil
    Informations personnelles :
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations forums :
    Inscription : Mai 2006
    Messages : 371
    Par défaut
    Examinons cette regex :
    Elle cherche à reconnaître un espace, suivi d'une lettre, suivi d'un deux-points, suivi de zéro, une ou plusieurs barres obliques inverses, suivies de la fin de la chaîne. Ça ne ressemble pas vraiment à ce que tu cherches. Tu n'aurais pas oublié un point quelque part, des fois ?

  3. #3
    Membre confirmé
    Profil pro
    Inscrit en
    Mars 2006
    Messages
    165
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2006
    Messages : 165
    Par défaut
    Salut, et merci

    l'expression englobe "zéro, une ou plusieurs barres obliques"
    je me suis emmelé les pinceaux tellement c'est complexe en fait le caractère * signifie effectivement "zéro ou plus occurrences du caractère précédent le *" donc il ne devrait pas y être vu que le fait qu'il n'y a qu'une barre \ après la lettre de lecteur et le deux-points fait partie de "l'énoncé". Donc déjà ça ne devrait pas être de cette forme plutot :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -n '/ [a-zA-Z]:\\$/s/^.*\( [a-zA-Z]:\\$\)/\1/p'
    Tu n'aurais pas oublié un point quelque part, des fois ?
    en fait j'avais aussi testé ceci

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -n '/ [a-zA-Z]:\\.*$/s/^.*\( [a-zA-Z]:\\*$\)/\1/p'
    avec le point avant le *$, mais ça ne fonctionnait pas plus.

    Si j'ai bien compris, le point dans une expression régulière indique n'importe quel caractère seul http://www.gentoo.org/doc/fr/articles/l-sed1.xml
    Mais, dans la formulation du problème, je ne vois pas où j'aurais besoin de situer "n'importe quel caractère seul" ?

  4. #4
    LLB
    LLB est déconnecté
    Membre émérite
    Inscrit en
    Mars 2002
    Messages
    968
    Détails du profil
    Informations forums :
    Inscription : Mars 2002
    Messages : 968
    Par défaut
    Citation Envoyé par eZula Voir le message
    Donc déjà ça ne devrait pas être de cette forme plutot :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -n '/ [a-zA-Z]:\\$/s/^.*\( [a-zA-Z]:\\$\)/\1/p'
    Le $, mets-le en dehors d'un groupe (tu n'as pas à le sélectionner ).
    Tu lui dis ici que le \ est en fin de ligne. Ce n'est pas ce que tu veux.

    Citation Envoyé par eZula Voir le message
    avec le point avant le *$, mais ça ne fonctionnait pas plus.
    Comment ça ?

    J'ai essayé ta commande (en ajoutant un point), sur ton fichier d'entrée, et ça marche.

    Note : l'espace qui est devant la lettre de lecteur, je pense que tu veux la sortir du groupe ( ).

  5. #5
    Membre confirmé
    Profil pro
    Inscrit en
    Mars 2006
    Messages
    165
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2006
    Messages : 165
    Par défaut
    Ok, alors comme ceci ça a l'air déjà mieux

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    sed -n '/\([a-zA-Z]:\\\).*$/s/^.*\([a-zA-Z]:\\.*$\)/\1/p'
     
    C:\windows\script vbs.vbs
    D:\fichier.txt
    mais il manque deux éléments dans le fichier (attention, qui n'est qu'un exemple l'idée est juste que ces chemins finissent les lignes dans un fichier en vrac) : f:\Dossier et C:\f.bat

    Je n'arrive pas à saisir comment sortir l'espace du groupe

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    sed -n '/\ ([a-zA-Z]:\\\).*$/s/^.*\([a-zA-Z]:\\.*$\)/\1/p' z
    sed: -e expression n°1, caractère 21: Échec du pairage de ) ou de \)
     
    sed -n '/\ ([a-zA-Z]:\\\).*$/s/^.*\([a-zA-Z]:\\.*$\)/\1/p' z
    sed: -e expression n°1, caractère 21: Échec du pairage de ) ou de \)

  6. #6
    Membre chevronné
    Avatar de Schmorgluck
    Profil pro
    Inscrit en
    Mai 2006
    Messages
    371
    Détails du profil
    Informations personnelles :
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations forums :
    Inscription : Mai 2006
    Messages : 371
    Par défaut
    Citation Envoyé par eZula Voir le message
    Ok, alors comme ceci ça a l'air déjà mieux
    Je n'arrive pas à saisir comment sortir l'espace du groupe
    En l'ignorant totalement dès le départ, peut-être ?
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -n '/[a-zA-Z]:\\.*$/ s/^.*\([a-zA-Z]:\\.*$\)/\1/p'
    Normalement, ça marche.
    Si, cependant, il peut arriver que tu aies une chaîne de la forme "aa:\" dans ton fichier et que dans ce cas là tu ne veux pas que ça corresponde, tu peux utiliser une ancre de début de mot \<, là où tu plaçais ton espace (en gros), comme ceci :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -n '/\<[a-zA-Z]:\\.*$/ s/^.*\<\([a-zA-Z]:\\.*$\)/\1/p'

  7. #7
    Membre émérite Avatar de BlaireauOne
    Profil pro
    Inscrit en
    Mars 2007
    Messages
    492
    Détails du profil
    Informations personnelles :
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Mars 2007
    Messages : 492
    Par défaut
    en fait j'avais aussi testé ceci

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -n '/ [a-zA-Z]:\\.*$/s/^.*\( [a-zA-Z]:\\*$\)/\1/p'
    avec le point avant le *$, mais ça ne fonctionnait pas plus.

    Si j'ai bien compris, le point dans une expression régulière indique n'importe quel caractère seul http://www.gentoo.org/doc/fr/articles/l-sed1.xml
    Mais, dans la formulation du problème, je ne vois pas où j'aurais besoin de situer "n'importe quel caractère seul" ?
    Il manque un point dans ton sed.
    Version correcte ci-dessous :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -n '/ [a-zA-Z]:\\.*$/s/^.*\( [a-zA-Z]:\\.*$\)/\1/p'

    Important à comprendre :
    . --> un caractère quelconque
    * --> 0 à n fois le caractère qui précède
    .* --> 0 à n fois un caractère quelconque


    [a-zA-Z]:\\.*$

    un caractère alphabétique (minuscule ou masjucule) suivi de
    un caractère : suivi de
    un caractère \ suivi de
    un caractère quelconque présent 0 à n fois jusqu'à la fin de la ligne


    La commande suivante est plus précise car on remplace le * par un +

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -n '/ [a-zA-Z]:\\.\+$/s/^.*\( [a-zA-Z]:\\.\+$\)/\1/p'
    * --> 0 à n fois le caractère qui précède
    + --> 1 à n fois le caractère qui précède

    Un peu prise de tête

Discussions similaires

  1. Extraire une sous chaine d'une chaine
    Par penguin50 dans le forum Ruby on Rails
    Réponses: 0
    Dernier message: 21/09/2008, 15h50
  2. extraire une sous chaine d'un char*
    Par john123 dans le forum C
    Réponses: 7
    Dernier message: 13/10/2007, 00h20
  3. Extraire une sous-chaine
    Par tomy29 dans le forum Delphi
    Réponses: 5
    Dernier message: 25/07/2007, 12h16
  4. Réponses: 6
    Dernier message: 25/06/2007, 11h00
  5. Réponses: 2
    Dernier message: 09/09/2006, 10h40

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo