IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

[Bash] Comparaison de contenu de fichiers/Recherche de matricule


Sujet :

Shell et commandes GNU

  1. #1
    Candidat au Club
    Femme Profil pro
    Analyste d'exploitation
    Inscrit en
    Octobre 2017
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : France

    Informations professionnelles :
    Activité : Analyste d'exploitation

    Informations forums :
    Inscription : Octobre 2017
    Messages : 17
    Points : 4
    Points
    4
    Par défaut [Bash] Comparaison de contenu de fichiers/Recherche de matricule
    Bonjour,

    J'ai effectué un certain nombre de contrôles de fichiers via des scripts batchs.

    Il y a un dernier contrôle sur lequel je bute.

    Pour résumer, j'ai deux fichiers "base.bdd" et "exploit"

    - Exemple de contenu dans le fichier "base.bdd" :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    "REF;"MODIF";"15000001";78600001";" ";" "
    "REF";"MODIF";"1980031";78600002";" ";" "
    "REF";"MODIF";"4480078";78600003";" ";" "
    "REF";"MODIF";"4480078";78600128";" ";" "

    - Exemple de contenu dans le fichier "exploit" :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    10|249|128|DUPONT|JEAN|03101961|
    20|249|128|383929829|39,01|
    40|249|128|362090909|49,00|
    40|249|128|362090909|49,00|
    80|58|128|41|
    80|58|128|41|
    1) Fichier base : en colonne 4 est indiqué le matricule
    => Je dois récupérer ce matricule sur les 5 derniers chiffres en otant les zéros. Par exemple, 78600001 deviendra 1 ! 78600128 deviendra 128 etc..

    2) Fichier exploit : seules les lignes qui commencent par 10 et 40 nous intéressent.
    Il faut que je verifie que ces lignes 10 et 40 existent bien pour les matricules tronqués du point1.
    Soit : 10|249|<matricule tronqué>
    40|249|<matricule tronqué>

    Cela fait plusieurs jours que je bute, les bonnes idées sont bienvenues :-/
    Merci

  2. #2
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 589
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 589
    Points : 19 474
    Points
    19 474
    Par défaut
    Bonjour,

    on va d'abord élaborer un algorithme.

    comment ferais-tu ça "à la main" ?

  3. #3
    Candidat au Club
    Femme Profil pro
    Analyste d'exploitation
    Inscrit en
    Octobre 2017
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : France

    Informations professionnelles :
    Activité : Analyste d'exploitation

    Informations forums :
    Inscription : Octobre 2017
    Messages : 17
    Points : 4
    Points
    4
    Par défaut
    En fait, c'est dés le debut que je bloquais pour "modifier le matricule à 5 caractères en otant les éventuels zéro à gauche".

    Je pensais à un awk dans ce genre là :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    awk -F ';|";|[|]' '/REF/ {t[substr($4, 4)+0]=1} /^10|^40/ && t[$3] {print $1 "|" $2 "|" $3}' base.bdd exploit

  4. #4
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 589
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 589
    Points : 19 474
    Points
    19 474
    Par défaut
    mais, c'est pas du bash !

  5. #5
    Candidat au Club
    Femme Profil pro
    Analyste d'exploitation
    Inscrit en
    Octobre 2017
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : France

    Informations professionnelles :
    Activité : Analyste d'exploitation

    Informations forums :
    Inscription : Octobre 2017
    Messages : 17
    Points : 4
    Points
    4
    Par défaut
    ben je pensais que awk etait une commande issue de la programmation unix (bash, ksh..) non ?

    P.S: je ne suis pas attachée à awk mais en lisant un cours sur la programmation shell, je me suis dit que cette commande etait bien pratique

  6. #6
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 589
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 589
    Points : 19 474
    Points
    19 474
    Par défaut
    oui, c'est bien pratique, et c'est bien plus rapide que bash, mais c'est un langage distinct, à part entière.

  7. #7
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2010
    Messages
    345
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 345
    Points : 539
    Points
    539
    Par défaut
    Bonjour,
    Après correction des petits bugs dans les exemples...
    Le départ étant avec awk
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    awk -F'";"' 'NR==FNR{a[substr($4,6)]}NR!=FNR&&!b{FS="|";b=1;$0=$0}NR!=FNR&&/10|40/{if($3 in a)print}' base.bdd exploit
    Analyser et revenir s'il y a des questions.
    Cordialement.

  8. #8
    Candidat au Club
    Femme Profil pro
    Analyste d'exploitation
    Inscrit en
    Octobre 2017
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : France

    Informations professionnelles :
    Activité : Analyste d'exploitation

    Informations forums :
    Inscription : Octobre 2017
    Messages : 17
    Points : 4
    Points
    4
    Par défaut
    Merci Ctaq pour ton aide précieuse.
    Pour info, j'ai lancé la commande, seules les lignes 40 apparaissent ainsi que deux lignes 100.
    Je vais essayer de chercher ou ca buggue

  9. #9
    Expert éminent Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 038
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 038
    Points : 8 405
    Points
    8 405
    Par défaut
    salut,

    Citation Envoyé par N_BaH Voir le message
    on va d'abord élaborer un algorithme.

    comment ferais-tu ça "à la main" ?
    meilleure suggestion

  10. #10
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2010
    Messages
    345
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 345
    Points : 539
    Points
    539
    Par défaut
    Salut,
    Je suis bien d'accord.
    on va d'abord élaborer un algorithme.
    quoi que, si tous le monde faisaient ça, il n'y aurait quasi plus de questions.
    De plus, j'avais glissé une petite coquille intentionnelle pour permettre d'étudier l'algorithme.
    Cordialement.

  11. #11
    Candidat au Club
    Femme Profil pro
    Analyste d'exploitation
    Inscrit en
    Octobre 2017
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : France

    Informations professionnelles :
    Activité : Analyste d'exploitation

    Informations forums :
    Inscription : Octobre 2017
    Messages : 17
    Points : 4
    Points
    4
    Par défaut
    lol Coquinou ctac!
    Je suis en train de décortiquer ton awk avec un tuto trouvé sur le net.

    Si cette commande a l'air vraiment puissante, je commence à comprendre ce que disait "N_Bah" : c'est vraiment un langage à part!:p

  12. #12
    Candidat au Club
    Femme Profil pro
    Analyste d'exploitation
    Inscrit en
    Octobre 2017
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : France

    Informations professionnelles :
    Activité : Analyste d'exploitation

    Informations forums :
    Inscription : Octobre 2017
    Messages : 17
    Points : 4
    Points
    4
    Par défaut
    bon ben je ne vois pas

    A la main,

    1) Sur Fichier "Base.bdd" en 4ème colonne -> Je formaterais le matricule sur 5 caractères max (en supprimant les zéros à gauche)
    2) Sur le fichier "Exploit" en 3ème colonne, je cherche la correspondance mais uniquement sur les lignes commencant par 10 et 40.
    3) S'il n'existe pas les lignes 10 et 40 pour un agent, les tracer en fichier log.


    => Pour le point 2, on peut tenter un egrep je suppose (^10 et ^40) mais c sur le point 1...je ne vois pas comment tronquer les 0...

  13. #13
    Expert éminent Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 038
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 038
    Points : 8 405
    Points
    8 405
    Par défaut
    Citation Envoyé par Cora98 Voir le message
    je ne vois pas comment tronquer les 0...
    avec un truc comme ça par exemple echo "78600128" | grep -Po "^.{5}0*\K.+" ou son équivalent coté awk gsub(/^.{5}0*/,"",$0)

  14. #14
    Candidat au Club
    Femme Profil pro
    Analyste d'exploitation
    Inscrit en
    Octobre 2017
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : France

    Informations professionnelles :
    Activité : Analyste d'exploitation

    Informations forums :
    Inscription : Octobre 2017
    Messages : 17
    Points : 4
    Points
    4
    Par défaut
    ce awk fonctionne :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    awk -F ';|";"|[|]' '/REF/ {t[substr($4, 4)+0]=1} /^10[|]|^40[|]/ && t[$3] {print $1 "|" $2 "|" $3}' base.bdd exploit
    il me manque plus que le 3eme point (tracage du log d'erreur) mais ca devrait etre plus facile

  15. #15
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2010
    Messages
    345
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 345
    Points : 539
    Points
    539
    Par défaut
    Oui, ça marche presque.
    Si tu rajoute une ligne correspondant aux critères comme :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    10|249|002|DUPONT|MICHEL|03101961|
    Elle ne resort pas, ça vient du tableau t qui ne contient pas les bonnes valeurs.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1 2 3 et 128 au lieu de 001 002 003 et 128
    la construction t[substr($4, 4)+0]=1 n'est pas bonne et ça ne sert a rien de lui affecter la valeur 1 car elle n'est jamais utilisée.
    Voilà une solution certainement perfectible.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    awk -F'";"' '
    NR==FNR{c=substr($4,6);a[c];d[c"_10"];d[c"_40"];next}
    !b{FS="|";b=1;$0=$0}
    ($3 in a)&&(($1==10)||($1==40)){d[$3"_"$1]++;print}
    END{for (i in d) if (!d[i]){split(i,e,"_");print "la ligne "e[2]" est absente pour l'"'"'utilisateur "e[1]>>"fichier.log"}}
    ' base.bdd exploit
    Cordialement.

  16. #16
    Expert éminent sénior Avatar de disedorgue
    Homme Profil pro
    Ingénieur intégration
    Inscrit en
    Décembre 2012
    Messages
    4 309
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur intégration
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Décembre 2012
    Messages : 4 309
    Points : 12 817
    Points
    12 817
    Par défaut
    Bonjour,

    Pour ne pas faire comme tout le monde :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed 's/^\([^;]*;\)\{3\}"[0-9]*\([0-9]\{5\}\).*/\2/;s/^0*\(.*\)/\/^\\(10\\|40\\)|[^|]*|\1|\/p/' base.bdd | sed -n -f - exploit

  17. #17
    Candidat au Club
    Femme Profil pro
    Analyste d'exploitation
    Inscrit en
    Octobre 2017
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : France

    Informations professionnelles :
    Activité : Analyste d'exploitation

    Informations forums :
    Inscription : Octobre 2017
    Messages : 17
    Points : 4
    Points
    4
    Par défaut
    :o Trop fort ctac! Merci
    C'est bizarre qu'il ressort les users ds le désordre
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    la ligne 10 est absente pour l'utilisateur 389
    la ligne 40 est absente pour l'utilisateur 703
    la ligne 40 est absente pour l'utilisateur 590
    la ligne 40 est absente pour l'utilisateur 468
    la ligne 10 est absente pour l'utilisateur 173
    la ligne 40 est absente pour l'utilisateur 519
    la ligne 10 est absente pour l'utilisateur 224
    la ligne 40 est absente pour l'utilisateur 190
    la ligne 40 est absente pour l'utilisateur 241
    etc
    Merci aussi à Dise

    Moi qui était réticente à sed et awk, ca me donne envie de m'y mettre!

  18. #18
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2010
    Messages
    345
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 345
    Points : 539
    Points
    539
    Par défaut
    Bien vu
    mais même punition pour une ligne 10|249|002|DUPONT|MICHEL|03101961|

    Citation Envoyé par disedorgue Voir le message
    Pour ne pas faire comme tout le monde :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed 's/^\([^;]*;\)\{3\}"[0-9]*\([0-9]\{5\}\).*/\2/;s/^0*\(.*\)/\/^\\(10\\|40\\)|[^|]*|\1|\/p/' base.bdd | sed -n -f - exploit
    Je propose cette mineure correction qui en plus simplifie la commande.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed 's/^\([^;]*;\)\{3\}"[0-9]*\([0-9]\{3\}\).*/\2/;s/\(.*\)/\/^\\(10\\|40\\)|[^|]*|\1|\/p/' base.bdd | sed -n -f - exploit
    Cordialement.

  19. #19
    Expert éminent sénior Avatar de disedorgue
    Homme Profil pro
    Ingénieur intégration
    Inscrit en
    Décembre 2012
    Messages
    4 309
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur intégration
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Décembre 2012
    Messages : 4 309
    Points : 12 817
    Points
    12 817
    Par défaut
    Non, pas d'accord pour la punition, je respecte la demande faite au post #1:
    1) Fichier base : en colonne 4 est indiqué le matricule
    => Je dois récupérer ce matricule sur les 5 derniers chiffres en otant les zéros. Par exemple, 78600001 deviendra 1 ! 78600128 deviendra 128 etc..
    Et sauf erreur de ma part, il n'y a pas eu de contre-ordre explicite

  20. #20
    Candidat au Club
    Femme Profil pro
    Analyste d'exploitation
    Inscrit en
    Octobre 2017
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : France

    Informations professionnelles :
    Activité : Analyste d'exploitation

    Informations forums :
    Inscription : Octobre 2017
    Messages : 17
    Points : 4
    Points
    4
    Par défaut
    Citation Envoyé par Cora98 Voir le message
    :o Trop fort ctac! Merci
    C'est bizarre qu'il ressort les users ds le désordre
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    la ligne 10 est absente pour l'utilisateur 389
    la ligne 40 est absente pour l'utilisateur 703
    la ligne 40 est absente pour l'utilisateur 590
    la ligne 40 est absente pour l'utilisateur 468
    la ligne 10 est absente pour l'utilisateur 173
    la ligne 40 est absente pour l'utilisateur 519
    la ligne 10 est absente pour l'utilisateur 224
    la ligne 40 est absente pour l'utilisateur 190
    la ligne 40 est absente pour l'utilisateur 241
    etc
    Merci aussi à Dise

    Moi qui était réticente à sed et awk, ca me donne envie de m'y mettre!
    Rectif : le awk de ctaq ressort uniquement que les lignes 40 (pas les dix).
    Dans le "sed" initial de Dise', les 10 et 40 sont affichées. Par contre, dans le sed rectifié par ctaq, seules les 40 sont indiquées à l'écran => Ctaq est "anti-10"

+ Répondre à la discussion
Cette discussion est résolue.
Page 1 sur 2 12 DernièreDernière

Discussions similaires

  1. [BASH] Comparaison de deux fichiers
    Par seanbean dans le forum Linux
    Réponses: 7
    Dernier message: 16/12/2010, 01h54
  2. Réponses: 0
    Dernier message: 14/11/2010, 15h22
  3. [MySQL] Recherche sur le contenu de fichiers
    Par Abou Zar dans le forum PHP & Base de données
    Réponses: 6
    Dernier message: 03/11/2009, 11h14
  4. Comparaison du contenu de fichiers
    Par piotrr dans le forum Visual Studio
    Réponses: 1
    Dernier message: 10/07/2009, 16h03
  5. Comparaison du contenu de 2 fichiers
    Par ecniv dans le forum Langage
    Réponses: 11
    Dernier message: 19/08/2006, 21h38

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo