Bonjour à tous,

Je viens vous demander de l'aide car j'ai besoin d'écrire un petit script en bash et je n'y connais rien !
Je suis statisticienne, je fais de la bio-informatique et je me sers de l'informatique afin de faire des études statistiques... Donc le bash ne m'a pas été très utile jusqu'ici...

Je vais sans doute être amenée à m'en servir davantage donc j'aimerais commencer à m'initer. Là j'en ai besoin pour modifier un fichier : s_garma-296_converted.sam qui se définit ainsi :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
 
more '/data/patient1/s_garma-296_converted.sam' 
@PG	ID:illumina_export2sam.pl	VN:2.0.0	CL:/usr/local/bin/illumina_export2sam.pl --read1=s_garma-296_1_export.txt --read2=s_garma-29
6_2_export.txt
HWI-ST584_81:4:1101:1176:2055	73	c18.fa	42449052	28	76M	*	0	0	NGAAATCTCACATTTGCCTTCTGCGATCCCACTTCTGTAGCTCT
CATCCAGGCTATGGTAAGTCCATTGCTGGTCA	############################################################################	BC:Z:TTAGGC	XD:Z:A75	SM:i:28	AS:i:0
HWI-ST584_81:4:1101:1176:2055	133	*	0	0	*	c18.fa	42449052	0	TGAAATCCTTTGAGGTCNNNNNNNNNNNNGTCACTGGCTGTGAG
GAGCTGCAAAAGAATAAAGAAATTTTCTCAGN	@@@FFFFFFHHHDHIFG###########################################################	BC:Z:TTAGGC
HWI-ST584_81:4:1101:1150:2056	73	c14.fa	95921912	28	76M	*	0	0	NCGCAGCTTCTCCAGAACTTTCCTCATCTCTTCCAGTTCTCCGG
TGATCTTCTCTGCACCCAAAGGAGAGGTGTTC	############################################################################	BC:Z:TTAGGC	XD:Z:G75	SM:i:28	AS:i:0
HWI-ST584_81:4:1101:1150:2056	133	*	0	0	*	c14.fa	95921912	0	CTACCCTCTTCAGGACANNNNNNNNNNNNTTCCCAGGGGCGAGG
AGTCTCTGGAGACGCTGGAGGAGCAGTCTGCN	@C@FF?DDHHDFDHHI?###########################################################	BC:Z:TTAGGC
HWI-ST584_81:4:1101:1235:2071	89	c1.fa	66031393	254	76M	*	0	0	AGTTAGGAATTCTCATACATGCTTATGATTAAAAATGCAAACCA
TAGTATAGGTGTATCAGTGTGAAAACGAAAAC	=GJGIJJIJJJJJJJIJJJJJIIJJJIHIHJJJJJJJJIHFJIJJJJJJJJJJIJJJJJJJJJHHHHHDFEFFCBB	BC:Z:TTAGGC	XD:Z:76	SM:i
:359	AS:i:0
en :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
more '/data/patient1/s_garma-296_converted.sam' 
@PG	ID:illumina_export2sam.pl	VN:2.0.0	CL:/usr/local/bin/illumina_export2sam.pl --read1=s_garma-296_1_export.txt --read2=s_garma-29
6_2_export.txt
HWI-ST584_81:4:1101:1176:2055	73	chr18	42449052	28	76M	*	0	0	NGAAATCTCACATTTGCCTTCTGCGATCCCACTTCTGTAGCTCT
CATCCAGGCTATGGTAAGTCCATTGCTGGTCA	############################################################################	BC:Z:TTAGGC	XD:Z:A75	SM:i:28	AS:i:0
HWI-ST584_81:4:1101:1176:2055	133	*	0	0	*	chr18	42449052	0	TGAAATCCTTTGAGGTCNNNNNNNNNNNNGTCACTGGCTGTGAG
GAGCTGCAAAAGAATAAAGAAATTTTCTCAGN	@@@FFFFFFHHHDHIFG###########################################################	BC:Z:TTAGGC
Je dois juste remplacer tous les c1.fa en chr1, ci.fa en chri.
D'habitude, je fais les modifications dans les fichiers avec R mais je ne peux pas ouvrir ce type de fichier avec R...

Je n'ai pas de début de proposition de code à vous proposer
J'ai commencé à regarder des tutos sur bash car j'aimerais dans un premier temps arriver à afficher par exemple chaque ligne d'un fichier ou la première valeur (colonne) de chaque ligne.

Enfin, je remarque que j'aurai une difficulté : dans les 2 premières lignes par exemple, les "c18.fa" ne sont pas placés dans les mêmes colonnes...

Merci à ceux qui pourront me donner des pistes pour régler mon problème,
Jane