J'ai une séquence au format fasta
>chr1
ATANTATACCGANNN
Je souhaite substituer la lettre N par rien et ensuite obtenir obtenir le nombre de lettre de la 2ième ligne,mais je bloque
Si quelqu'un peux m'aider!
Résultat attendu
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11 #!/bin/bash for i do echo $i len=$(echo $i | sed 's/N//g' | awk "NR \"% 2\" == 1" #calculer taille séquence après avoir enlevé le N (i.e 11) nomseq= #récupérer le nom de la séquence (i.e chr1) echo length:$len cnt=$(echo $i | grep -oh 'C\|G\|g\|c' |awk "NR \"% 2\" == 1 ) #calcul le nombre G et C (i.e 3) gc=$(awk "BEGIN {printf \"%.2f\",${cnt}/${len}}") echo -e $nomseq"\t$gc done
chr1 0.27
Partager