IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

Comparer deux fichiers avec grep et afficher les lignes absentes du premier fichier


Sujet :

Shell et commandes GNU

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre Expert
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Avril 2013
    Messages
    2 005
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Administrateur de base de données
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Avril 2013
    Messages : 2 005
    Par défaut Comparer deux fichiers avec grep et afficher les lignes absentes du premier fichier
    Bonjour tout le monde,

    J'ai un besoin assez simple mais je galère pour le résoudre.
    J'ai deux fichiers et je voudrais afficher uniquement les lignes (de un seul mot) du fichier 1 qui ne se trouvent pas dans le fichier 2 (qui lui contient des milliers de lignes de N mots).

    Exemple :
    Fichier 1
    test
    amour
    police
    eglise
    Fichier 2
    bonjour toto
    au revoir tata
    amour et paix
    travailler dans la police 
    armee pays
    perte 
    Si je lance la commande suivante, j'obtiens les mots du fichier 1 qui sont dans le fichier 2.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    [oracle@vbgeneric ~]$ grep -f zz01 zz02
    amour et paix
    travailler dans la police 
    Ce que je voudrais comme sortie c'est
    test
    eglise
    
    Bonne journée et merci pour vos conseils

  2. #2
    Expert confirmé Avatar de Flodelarab
    Homme Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5 291
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente (Poitou Charente)

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5 291
    Par défaut
    Bonjour

    Avant toute chose, une mise en garde : "test" est dans le mot "testament". Comment traiter ce cas ?

    Ensuite, a priori, on peut retraiter le fichier 2 pour filtrer le fichier 1.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    $ grep -vf <(grep -o '[[:alpha:]]*' zz02.txt) zz01.txt
    test
    eglise
    <() est une substitution de processus. Cela permet de considérer la sortie de commande comme un fichier. C'est un bash-isme.

    [edit]Ou plus simplement
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    $ grep -o '[[:alpha:]]*' zz02.txt | grep -vf - zz01.txt
    test
    eglise
    [/edit]

  3. #3
    Membre Expert
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Avril 2013
    Messages
    2 005
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Administrateur de base de données
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Avril 2013
    Messages : 2 005
    Par défaut
    Un gros gros merci, je n'aurais jamais trouvé cette solution

    L'exemple de "test" était simplifié, en réalité j'ai dans le premier fichier des noms de tables Oracle suffisamment longs pour ne pas avoir à gérer le problème avec "testament".

  4. #4
    Expert confirmé Avatar de Flodelarab
    Homme Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5 291
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente (Poitou Charente)

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5 291
    Par défaut
    1. Attention aux suffixes, même avec des noms longs et inimitables.
    2. Si tu as des nombres dans tes noms de table, peut-être préféreras-tu [[:alnum:]] à [[:alpha:]] ? Et ajouter les tirets-bas _ ?

  5. #5
    Membre Expert
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Avril 2013
    Messages
    2 005
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Administrateur de base de données
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Avril 2013
    Messages : 2 005
    Par défaut
    Aïe aïe aïe, ça ne marche pas... visiblement mon jeu de test était bien trop simple.

    Je mets en pièces jointes les deux fichiers que j'utilise : enfin, un extract car la taille des fichiers est limitée à 64Ko sur ce site et mes fichiers sont plus gros.
    zzddl - Copie.txt
    zzawr - Copie.txt

    Dans le résultat du grep, il faut afficher par exemple "SYS"."WRH$_OSSTAT", "SYS"."WRH$_PARAMETER" mais pas "SYS"."WRH$_SQLCOMMAND_NAME" ni "SYS"."WRH$_PLAN_OPERATION_NAME" entre autres.

    Voilà, merci pour ton aide Flodelarab.

  6. #6
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 659
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 659
    Par défaut
    :shock:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    $ head -5 /tmp/zzawr\ -\ Copie.txt | cat -E
    WRH$_ACTIVE_SESSION_HISTORY                                                                                                                                                                             $
    WRH$_ACTIVE_SESSION_HISTORY_BL                                                                                                                                                                          $
    WRH$_ASM_BAD_DISK                                                                                                                                                                                       $
    WRH$_ASM_DISKGROUP                                                                                                                                                                                      $
    WRH$_ASM_DISKGROUP_STAT                                                                                                                                                                                 $

    c'est normal ?
    N'oubliez pas de consulter les cours shell, la FAQ, et les pages man.

  7. #7
    Expert confirmé Avatar de Flodelarab
    Homme Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5 291
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente (Poitou Charente)

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5 291
    Par défaut
    C'est ce que je disais. Il faut ajouter le tiret-bas, les chiffres et le dollar.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    $ grep -o '[[:alnum:]_$]*' zzddl\ -\ Copie.txt | grep -vf - zzawr\ -\ Copie.txt
    WRH$_CR_BLOCK_SERVER
    WRH$_LOG
    WRI$_EMX_FILES
    Mais comme le montre N_BaH, il y a bien un problème de suffixe :
    WRH$_ACTIVE_SESSION_HISTORY est contenu dans WRH$_ACTIVE_SESSION_HISTORY_BL.
    WRH$_ASM_DISKGROUP est contenu dans WRH$_ASM_DISKGROUP_STAT.

Discussions similaires

  1. Réponses: 11
    Dernier message: 04/02/2012, 18h24
  2. Réponses: 5
    Dernier message: 04/04/2010, 00h14
  3. Comparer deux fichiers avec VBA
    Par Bricoltou dans le forum Macros et VBA Excel
    Réponses: 2
    Dernier message: 25/11/2009, 23h23
  4. Comparer deux fichiers, sauf les noms
    Par neuro6 dans le forum Algorithmes et structures de données
    Réponses: 3
    Dernier message: 05/11/2007, 17h54
  5. comparer deux fichiers avec une api windows
    Par sweetdreamer dans le forum Windows
    Réponses: 4
    Dernier message: 25/05/2006, 22h10

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo