IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Linux Discussion :

[BASH] find -execdir et cat


Sujet :

Linux

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Juin 2004
    Messages
    37
    Détails du profil
    Informations personnelles :
    Âge : 41
    Localisation : France

    Informations forums :
    Inscription : Juin 2004
    Messages : 37
    Par défaut [BASH] find -execdir et cat
    Bonjour,

    je suis confronté a un probleme auquel je ne trouve pas de solution dans les man respectifs. J'ai une arborescence de fichiers dans laquelle certains sous-dossiers contiennent des fichiers de type *.fastq. (de 1 à 5 en general)
    Pour chaque fichier fastq j'ai un ou plusieurs fichiers .map du meme nom, donc par exemple :

    Racine
    |
    + A
    | | monfic1.fastq
    | | monfic1.fastq.0.map
    | | monfic1.fastq.1.map
    | | monfic1.fastq.2.map
    | | monfic2.fastq
    | | monfic2.fastq.0.map
    | | monfic2.fastq.1.map
    |
    + B
    | | monfic1.fastq
    | | monfic1.fastq.0.map
    | | monfic2.fastq
    | | monfic2.fastq.0.map
    | | monfic2.fastq.1.map
    | | monfic2.fastq.2.map
    | | monfic2.fastq.3.map
    |
    etc etc...


    Bref pour simplifier la suite de mon analyse j'aimerais concatener tous les fichiers map correspondant a chaque fichier fastq et les garder dans le meme sous dossier.

    Donc par exemple pour le sous-dossier A me retrouver avec deux fichiers supplementaires :
    monfic1.fastq.CONCATENATED_MAP.map
    et
    monfic2.fastq.CONCATENATED_MAP.map

    J'ai fait un premier test pour verifier la concatenation (sans prendre en compte qu'il peut y avoir plusieurs fastq dans le meme sous dossier) :

    find Racine/ -name *.fastq.*.map - execdir cat '{}' > TEST +

    => resultat le fichier TEST est créé dans Racine... premier echec, je n'arrive pas a rediriger le resultat du cat dans le sous-dossier, je pensais que si la redirection etait avant le "+" toute la commande etait consodérée comme executée dans le sous dossier..

    Deuxieme test pour vérifier si je peux passer au cat tous les fichiers map correspondant à un seul fichier fastq du sous dossier :

    find Racine/ -name *.fastq - execdir cat '{}'*.map > TEST \;

    bon la c'est stupide j'avoue mais j'ai au moins appris que c'est le bash au moment de lancer la commande qui remplace les etoiles par le nom des fichiers... mais comment faire alors ? Peut on imbriquer plusieurs find ? Peut on appeler la fonction de completion des noms de fichiers ?

    Voila j'ai fait de nombreux tests, beaucoup stupides, et je n'arrive pas a mes fins, si vous avez des indices des pistes ou meme une solution je vous en serait super reconnaissant... L'arboresence est gigantesque et les fichiers imposants

    Merci @ bientot !

  2. #2
    Membre Expert Avatar de jabbounet
    Homme Profil pro
    Consultant informatique
    Inscrit en
    Juin 2009
    Messages
    1 909
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49

    Informations professionnelles :
    Activité : Consultant informatique

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 909
    Par défaut
    pas optimisé/ni testé mais l'idée est là
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
     
    #!/bin/ksh
    find . -type f -name '*.fastq' | while read f
    do
       cat $f > $f.CONCATENATED_MAP.map
       for i in `seq 0 10`
       do
          if [ -f $f.$i.map ]
          then
               cat $f.$i.map >> $f.CONCATENATED_MAP.map
          fi
       done
    done
    peux être améliorier en comptant le nombre de fichier.map, et en itérant dessus au lieu d'une bête sequence `seq 0 10`

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Juin 2004
    Messages
    37
    Détails du profil
    Informations personnelles :
    Âge : 41
    Localisation : France

    Informations forums :
    Inscription : Juin 2004
    Messages : 37
    Par défaut
    Bonjour et merci pour ton aide !

    Ok merci il faut donc passer par du scripting carrement

    Je vais voir ca et adapter pour le faire fonctionner alors, merci !!

  4. #4
    Membre Expert Avatar de jabbounet
    Homme Profil pro
    Consultant informatique
    Inscrit en
    Juin 2009
    Messages
    1 909
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49

    Informations professionnelles :
    Activité : Consultant informatique

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 909
    Par défaut
    Citation Envoyé par Bouteille Voir le message
    Bonjour et merci pour ton aide !

    Ok merci il faut donc passer par du scripting carrement

    Je vais voir ca et adapter pour le faire fonctionner alors, merci !!
    pas forcement, ce que j'ai tappé tiens aussi sur une ligne de commande, mais quand ça commence à devenir un traitement complexe passer au script est plus pertinent/clair/efficace.

    en ligne de commande ça donne (au vue de mon history sur le shell)
    Citation Envoyé par History
    $history
    ...
    354 set -x
    355 find . -type f -name '*.fastq' | while read f; do cat $f > $f.CONCATENATED_MAP.map; for i in `seq 0 10`; do if [ -f $f.$i.map ]; then cat $f.$i.map >> $f.CONCATENATED_MAP.map; fi; done; done
    ...

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Juin 2004
    Messages
    37
    Détails du profil
    Informations personnelles :
    Âge : 41
    Localisation : France

    Informations forums :
    Inscription : Juin 2004
    Messages : 37
    Par défaut
    Ok, c'est juste l'emploi d'un for qui me faisait faire reference au scripting, mais peu importe

    et sinon quelque chose comme ca du coup ca pourrait marcher ?

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    ## Concatenate all the map files in one for each fastq
    find ./ -type f -name '*.fastq' | while read fastqFILE
    do
       find ./ -type f -name '$fastqFILE.*.map' -execdir cat {} > $fastqFILE.CONCATENATED_MAP.map +
    done
    En fait je vais tester et je te tiens au courant

  6. #6
    Membre Expert Avatar de jabbounet
    Homme Profil pro
    Consultant informatique
    Inscrit en
    Juin 2009
    Messages
    1 909
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49

    Informations professionnelles :
    Activité : Consultant informatique

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 909
    Par défaut
    Citation Envoyé par Bouteille Voir le message
    Ok, c'est juste l'emploi d'un for qui me faisait faire reference au scripting, mais peu importe

    et sinon quelque chose comme ca du coup ca pourrait marcher ?

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    ## Concatenate all the map files in one for each fastq
    find ./ -type f -name '*.fastq' | while read fastqFILE
    do
       find ./ -type f -name '$fastqFILE.*.map' -execdir cat {} > $fastqFILE.CONCATENATED_MAP.map +
    done
    En fait je vais tester et je te tiens au courant
    Quelque chose te garantie que cela va te les concaterner dans le bon ordre 0,1,2,3,4,...?

    En plus je pense que "cat {} >" va ecraser successivement les fichiers et te laisser le contenu du dernier traité.

    Ensuite imbriquer des find je ne suis pas très fan, déjà que on ne sait jamais trop ou find nous mène....
    Maintenant que tu as le fichier avec son chemin complet, tu peux utiliser la commande dirname pour avoir le chemin et l'utiliser, et ls pour parcourir le contenu du repertoire.
    http://linux.die.net/man/1/dirname

  7. #7
    Membre averti
    Profil pro
    Inscrit en
    Juin 2004
    Messages
    37
    Détails du profil
    Informations personnelles :
    Âge : 41
    Localisation : France

    Informations forums :
    Inscription : Juin 2004
    Messages : 37
    Par défaut
    Et voila la solution retenue qui marche :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    find ./ -type f -name '*.fastq' | while read fastqFILE
    do
       basename=`basename "$fastqFILE"`
       find ./ -type f -name $basename*aligned*.map -execdir cat {} > $fastqFILE.CONCATENATED_MAP.map +
    done
    En fait ma derniere proposition ne marchait pas car j'avais le chemin complet dans $fastqFILE donc le deuxieme find faisait la gueule...

    D'ailleurs je n'ai pas été assez précis dans ma question, en effet, les fichiers maps sont de la forme monfic1.fastq.ALIGNED.0.map, ce qui me permet de faire le second find avec "aligned" et ainsi eviter de recuperer le resultat d'une premiere concatenation (le CONCATENATED_MAP)... Ca aurait fait une belle boucle infinie et rempli le disque dur je pense

    Maintenant tout fonctionne merci bcp pour ton aide précieuse ! A l'ordi de bosser un peu

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Bash find *[31]01*
    Par cyberrage01 dans le forum Linux
    Réponses: 10
    Dernier message: 31/01/2011, 21h05
  2. Scripts BASH & commande Find
    Par GoodWear dans le forum Administration système
    Réponses: 2
    Dernier message: 09/10/2009, 09h25
  3. cat espace et script bash
    Par krikrizzz dans le forum Shell et commandes GNU
    Réponses: 15
    Dernier message: 20/08/2009, 16h30
  4. [bash] utilisation de CAT/AWK pour parser un fichier CSV
    Par arnaudperfect dans le forum Shell et commandes GNU
    Réponses: 32
    Dernier message: 25/07/2007, 23h34
  5. fonction python similaire à find en bash
    Par deb75 dans le forum Général Python
    Réponses: 1
    Dernier message: 21/12/2005, 11h48

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo