IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

Afficher les différences entre les colonnes de 2 fichiers


Sujet :

Shell et commandes GNU

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Février 2010
    Messages
    51
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 51
    Par défaut Afficher les différences entre les colonnes de 2 fichiers
    Bonjour,

    Initialement, j'avais deux fichiers générés par un script dont je devais comparer le contenu (1 seul colonne par fichier). J'utilisais la commande "comm" pour afficher les différences dans les deux fichiers. Je n'avais pas de souci.

    Sauf que chaque fichier dispose dorénavant d'une colonne supplémentaire.

    Fichier index (colonne 1: Identifiant A/Colonne 2 : Identifiant B) :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    510100;98110
    510025;98230
    510303;98150
    510400;97998
    525500;97450
    525750;97520
    525800;98751
    530920;94573

    Fichier Listing (Colonne 1 : Identifiant A) :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    525500;LUPIN Arsene
    510303;COLUMBO Raphael
    510400;BAUER Jack
    525700;GYVER Mac
    525800;SMITH Hannibal

    Ce que je dois afficher à l'écran :

    1. Les agents présents dans Listing mais absents de Index : Afficher Identifiant A + Nom

    2. Les agents présents dans Index mais absents de Listing : Afficher leur Identifiant A et Identifiant B (indiqué dans le fichier Index)


    Le script sera lancé avec un ou plusieurs arguments sur 3 chiffres qui correspondra au service (3 premiers caractères de l'identifiant A). C'est à dire que l'affichage devra tenir compte du service indiqué. Inutile de polluer les réponses avec des utilisateurs d'un autre service. Exemple : nom du script 510 => les réponses devront tenir compte uniquement des identifiants commencant par 510. Bon pour ca, j'ai pensé à egrep "^$nomduservice" pour filtrer l'affichage.

    Auriez vous une piste pour m'aider svp ?

    Merci

  2. #2
    Expert confirmé Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 041
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 041
    Par défaut
    salut,

    Citation Envoyé par heracles777 Voir le message
    Ce que je dois afficher à l'écran :
    1. Les agents présents dans Listing mais absents de Index : Afficher Identifiant A + Nom
    2. Les agents présents dans Index mais absents de Listing : Afficher leur Identifiant A et Identifiant B (indiqué dans le fichier Index)


    Le script sera lancé avec un ou plusieurs arguments sur 3 chiffres qui correspondra au service (...)
    bon à ce stade c'est une moulinette complète que tu dois faire, à moins de partager la fiche de paye ou la note du prof à la fin pas sûr que quelqu'un ait envie de faire le boulot à ta place, montre plutôt ce que tu as fais niveau code et on essaiera de corriger

    pour te donner des pistes, à moins qu'il ne s'agisse d'une contrainte forte le faire en awk plutôt qu'en bash est probablement un gain de temps et de rapidité, et si les fichiers ne font pas plusieurs Go tu peux envisager de les mettre en mémoire (créer un tableau en mémoire avec les données du premier fichier pour pouvoir traiter le second ligne par ligne ensuite en gros)

  3. #3
    Expert confirmé Avatar de disedorgue
    Homme Profil pro
    Ingénieur intégration
    Inscrit en
    Décembre 2012
    Messages
    4 357
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur intégration
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Décembre 2012
    Messages : 4 357
    Par défaut
    Bonjour,

    Est-ce toutes les lignes, que cela soit dans index ou dans listing, ont une valeur pour chaque colonne ou bien une des colonnes peut-être vide ?

    Si pas de vide, il suffit de "merger" les 2 fichiers sur identifiant A ce qui te fera un fichier sur 3 colonnes. Ensuite il n'y aura plus qu'a extraire de ce fichier toutes les lignes qui possèdent une des 3 colonnes vides (dans les faits, il ne pourra y avoir que la colonne identifant b ou la colonne Nom de vide).

  4. #4
    Expert confirmé Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 041
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 041
    Par défaut
    Citation Envoyé par disedorgue Voir le message
    il suffit de "merger" les 2 fichiers sur identifiant A
    oui, et l'ensemble du programme tient en 1 ligne relativement courte contrairement à ce que j'envisageais (ligne vide ou pas d'ailleurs, testé.)

  5. #5
    Expert confirmé Avatar de disedorgue
    Homme Profil pro
    Ingénieur intégration
    Inscrit en
    Décembre 2012
    Messages
    4 357
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur intégration
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Décembre 2012
    Messages : 4 357
    Par défaut
    Par contre, à priori, dans son exemple, Arsène Lupin semble avoir pris l'identité de Mac Gyver ou alors c'est l'inverse... Va savoir avec ces 2 lascars.

  6. #6
    Membre averti
    Profil pro
    Inscrit en
    Février 2010
    Messages
    51
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 51
    Par défaut
    Citation Envoyé par disedorgue Voir le message
    Par contre, à priori, dans son exemple, Arsène Lupin semble avoir pris l'identité de Mac Gyver ou alors c'est l'inverse... Va savoir avec ces 2 lascars.
    J'ai rendu à Mac Gyver sa bonne identité

    En fait, ne maitrisant pas le awk, j'étais parti sur un join de ce style pour le point 2 :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    join -t ';' -v 2 -1 1 -2 1  listing index
    Mais c vrai que c'est pas terrible car il ne me filtre pas directement les réponses par service (argument du script sur 3 caractères). Il faudra que je passe par un "egrep" ensuite...

    Je n'avais pas pensé au merge..je vais jeter un oeil sur les paramètres de cette commande.

    Merci

  7. #7
    Expert confirmé Avatar de disedorgue
    Homme Profil pro
    Ingénieur intégration
    Inscrit en
    Décembre 2012
    Messages
    4 357
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur intégration
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Décembre 2012
    Messages : 4 357
    Par défaut
    Bon, essaye ça:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    awk -F\; '{A[$1]=A[$1]";"$2}END{for (i in A){$0=i A[i];if(NF==2) print}}' listing index

  8. #8
    Expert confirmé Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 041
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 041
    Par défaut
    Citation Envoyé par heracles777 Voir le message
    En fait, ne maitrisant pas le awk, j'étais parti sur un join
    oui, et t'as complètement raison, c'est moi qui ai pas été suffisamment perspicace plus haut

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    #!/bin/bash
    IFS='|' args="$*"
    join -j1 -v1 -v2 -t';' <(sort -nk1 index) <(sort -nk1 listing) | grep -E "^(${args})"
    on trie les fichiers au préalable, on double l'option -v pour afficher ce qui manque dans les deux sens, le coup de l'IFS est un bonus, pour être strict on pourrait au minimum vérifier que chaque paramètre fait bien 3 caractères comme indiqué

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 0
    Dernier message: 05/06/2009, 12h04
  2. Réponses: 12
    Dernier message: 03/03/2009, 09h01
  3. [EJB] Différence entre les EJB et les JavaBeans
    Par cool dans le forum Java EE
    Réponses: 6
    Dernier message: 22/05/2008, 20h24
  4. [C#] Diffèrence entre les structures et les classes
    Par Kr00pS dans le forum Windows Forms
    Réponses: 2
    Dernier message: 31/08/2006, 12h42

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo