Coucou,
J'ai un pb d'expression reguliere et je n'arrive pas a trouver la cause ...
En fait je lis un fichier de sequences au format fasta et je veux recupere qu'une partie des sequences.
Il y a deux types de sequences :
Moi je veux recuperer seulement les sequences qui possedent une defline comme le 2 eme exemple...
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10 >TC205357 GP|8698673|gb|AAF78470.1|AF180887_1|AF180887 skeletal alpha1 actin {Danio rerio} AACATTGGTAGGAGAGAGATCGATCGACCAACTCTGCTGTAACAATGTTCCAAAACCCAC AGTTTATATACAGGTTTTTCCTATAGTCATCATGAAACAGTGGAAGCATCAGTCTTGTGA OU >TC205358 CACTCAGACTGGTTCTTCTGCTCCCTTCACTCTGCAAAGACTACTCCAGGGTAAAGGTTT AACAAGCCCACTTGTATCAGTACCTTCAACCCCATACATATCTGTATCATTGCCCCAAGG
while (<SEQ>) {
if ($_ =~ /^>.*/x) {
$id = $_;
if ($id =~ /^>TC \d*\s*/x) {
print "$id\n";
}
}
}
Ceci m'affiche tous les identifiants alors que moi je veux uniquement les TC..... et rien d'autre apres
Perlgirl
Partager