Bonjour à tous,
Je viens vous demander de l'aide car j'ai besoin d'écrire un petit script en bash et je n'y connais rien !
Je suis statisticienne, je fais de la bio-informatique et je me sers de l'informatique afin de faire des études statistiques... Donc le bash ne m'a pas été très utile jusqu'ici...
Je vais sans doute être amenée à m'en servir davantage donc j'aimerais commencer à m'initer. Là j'en ai besoin pour modifier un fichier : s_garma-296_converted.sam qui se définit ainsi :
en :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 more '/data/patient1/s_garma-296_converted.sam' @PG ID:illumina_export2sam.pl VN:2.0.0 CL:/usr/local/bin/illumina_export2sam.pl --read1=s_garma-296_1_export.txt --read2=s_garma-29 6_2_export.txt HWI-ST584_81:4:1101:1176:2055 73 c18.fa 42449052 28 76M * 0 0 NGAAATCTCACATTTGCCTTCTGCGATCCCACTTCTGTAGCTCT CATCCAGGCTATGGTAAGTCCATTGCTGGTCA ############################################################################ BC:Z:TTAGGC XD:Z:A75 SM:i:28 AS:i:0 HWI-ST584_81:4:1101:1176:2055 133 * 0 0 * c18.fa 42449052 0 TGAAATCCTTTGAGGTCNNNNNNNNNNNNGTCACTGGCTGTGAG GAGCTGCAAAAGAATAAAGAAATTTTCTCAGN @@@FFFFFFHHHDHIFG########################################################### BC:Z:TTAGGC HWI-ST584_81:4:1101:1150:2056 73 c14.fa 95921912 28 76M * 0 0 NCGCAGCTTCTCCAGAACTTTCCTCATCTCTTCCAGTTCTCCGG TGATCTTCTCTGCACCCAAAGGAGAGGTGTTC ############################################################################ BC:Z:TTAGGC XD:Z:G75 SM:i:28 AS:i:0 HWI-ST584_81:4:1101:1150:2056 133 * 0 0 * c14.fa 95921912 0 CTACCCTCTTCAGGACANNNNNNNNNNNNTTCCCAGGGGCGAGG AGTCTCTGGAGACGCTGGAGGAGCAGTCTGCN @C@FF?DDHHDFDHHI?########################################################### BC:Z:TTAGGC HWI-ST584_81:4:1101:1235:2071 89 c1.fa 66031393 254 76M * 0 0 AGTTAGGAATTCTCATACATGCTTATGATTAAAAATGCAAACCA TAGTATAGGTGTATCAGTGTGAAAACGAAAAC =GJGIJJIJJJJJJJIJJJJJIIJJJIHIHJJJJJJJJIHFJIJJJJJJJJJJIJJJJJJJJJHHHHHDFEFFCBB BC:Z:TTAGGC XD:Z:76 SM:i :359 AS:i:0
Je dois juste remplacer tous les c1.fa en chr1, ci.fa en chri.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8 more '/data/patient1/s_garma-296_converted.sam' @PG ID:illumina_export2sam.pl VN:2.0.0 CL:/usr/local/bin/illumina_export2sam.pl --read1=s_garma-296_1_export.txt --read2=s_garma-29 6_2_export.txt HWI-ST584_81:4:1101:1176:2055 73 chr18 42449052 28 76M * 0 0 NGAAATCTCACATTTGCCTTCTGCGATCCCACTTCTGTAGCTCT CATCCAGGCTATGGTAAGTCCATTGCTGGTCA ############################################################################ BC:Z:TTAGGC XD:Z:A75 SM:i:28 AS:i:0 HWI-ST584_81:4:1101:1176:2055 133 * 0 0 * chr18 42449052 0 TGAAATCCTTTGAGGTCNNNNNNNNNNNNGTCACTGGCTGTGAG GAGCTGCAAAAGAATAAAGAAATTTTCTCAGN @@@FFFFFFHHHDHIFG########################################################### BC:Z:TTAGGC
D'habitude, je fais les modifications dans les fichiers avec R mais je ne peux pas ouvrir ce type de fichier avec R...
Je n'ai pas de début de proposition de code à vous proposer
J'ai commencé à regarder des tutos sur bash car j'aimerais dans un premier temps arriver à afficher par exemple chaque ligne d'un fichier ou la première valeur (colonne) de chaque ligne.
Enfin, je remarque que j'aurai une difficulté : dans les 2 premières lignes par exemple, les "c18.fa" ne sont pas placés dans les mêmes colonnes...
Merci à ceux qui pourront me donner des pistes pour régler mon problème,
Jane
Partager