maximum d'une entité dans un fichier
Bonjour à tous,
J'ai un fichier de ce type :
>rho-RA
ATGCGTAGC
>rho-RB
ATGCGTAGCATGCGTAGC
>rho-RC
ATGCGTAGCATGCGTAGCATGCGTAGCATGCGTAGC
>pax6-RA
GCTGCATGATAG
>pax6-RB
GCTGCATGATAGGCTGCATGATAG
donc, je veux en premier temps determiner la taille de chacune des séquences, j'ai donc écrit cela :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13
| my $fichier = 'test.fa';
open my $fh, '<', $fichier or die "Impossible de lire le fichier $fichier\n";
while ( my $ligne = <$fh> ) {
chomp $ligne;
if ($ligne =~ m{^>} ) {
print "$ligne\t";
}
else{
my $length = length($ligne);
print "$length\n";
}
}
close $fichier; |
Mais j'aimerai qu'il ne m'affiche pour chaque entité (ie dans l'exemple rho et pax6) seulement le transcript (RA,RB...) qui a la plus grande sequence, dans l'exemple rho-RC et pax6-RB
je ne sais pas comment faire, quelqu'un pourrait m'aider ?
merci d'avance,
et bonne fête de fin d'année :)