Précédent   Forum du club des développeurs et IT Pro > Autres langages > Perl > Bioinformatique
Bioinformatique Toutes vos questions sur les scripts Perl associés à la bioinformatique, modules bioperl, projets bioinformatiques, etc ... Avant de poster, veuillez consulter les cours Perl et les critiques de livres.
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse
 
Outils de la discussion
Publicité
'
Vieux 13/06/2012, 14h36   #1
pontarose
Futur Membre du Club
 
Inscription : août 2007
Messages : 79
Détails du profil
Informations forums :
Inscription : août 2007
Messages : 79
Points : 15
Points : 15
Par défaut Extraire une sous-séquence d'un fasta

Bonjour,

Je possède la séquence au format fasta.
Je souhaiterai extraire une région de cette séquence, connaissant les positions de début et de fin de la région à extraire.
Je pensais à substring mais j'ai une grande séquence 30Mb, ce qui risque de prendre du temps.

Existe t-il quelque chose au niveau de bioperl?

Merci par avance
pontarose est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 13/06/2012, 15h07   #2
Philou67430
Expert Confirmé
 
Inscription : avril 2009
Messages : 2 641
Détails du profil
Informations personnelles :
Âge : 47

Informations forums :
Inscription : avril 2009
Messages : 2 641
Points : 3 090
Points : 3 090
A déplacer dans le forum "bioinformatique"... (voir avec Djibril).
__________________
Plus j'apprends, et plus je mesure mon ignorance (philou67430)
Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
Using strict and warnings is good for you.
Philou67430 est actuellement connecté   Envoyer un message privé Réponse avec citation 00
Vieux 14/06/2012, 12h12   #3
pontarose
Futur Membre du Club
 
Inscription : août 2007
Messages : 79
Détails du profil
Informations forums :
Inscription : août 2007
Messages : 79
Points : 15
Points : 15
Désolé, manque d'attention

now, to actually get at the sequence object, use the standard Bio::Seq
methods (look at Bio::Seq if you don't know what they are)

use Bio::SeqIO;

$in = Bio::SeqIO->new(-file => "inputfilename" , '-format' => 'genbank');

while ( my $seq = $in->next_seq() ) {
print "Sequence ",$seq->id," first 10 bases ",$seq->subseq(1,10),"\n";
}
pontarose est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 20/06/2012, 02h43   #4
Quantactique
Membre du Club
 
Homme
Étudiant
Inscription : avril 2012
Messages : 58
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : avril 2012
Messages : 58
Points : 56
Points : 56
Il me semble que tu peux utiliser la fonction subseq.

Je crois qu'elle s'utilise comme ceci :

Code :
$sous_seq = $obj -> subseq(position initiale, nombre de bases à extraire);
Sachant qu'il considère que la première base est la N°1.

Ainsi
Code :
$sous_seq = $obj->subseq(1,5);
Renvoie les 5 premières bases.

Je ne la connais pas bien et ne connais absolument pas ses performances mais bon, à tester. Tu pourra indiquer si elle semble rapide si tu t'en sert ? C'est toujours bon à savoir ^^
Quantactique est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse
Outils de la discussion

Navigation rapide


Fuseau horaire GMT +2. Il est actuellement 16h20.


 
 
 
 
Partenaires

Hébergement Web