-
BLAST - serialisation
Bonjour,
Pourriez vous réfléchir avec moi, concernant un problème de "time consuming".
Je lance mon blast protéique via le module BioPerl mais j'ai un fichier de séquence trop gros (3000 séquences).
Le blastp se fait au final au bout d'un temps certain (surtout que je risque d'avoir plusieurs gros fichiers a analyser !)
Connaissez vous des astuces pour rendre blast plus rapide, ou sérialiser son analyse (autrement que via le split de mon gros fichier en plus petit fichier).
Merci beaucoup d'avance,
Le sujet a peut être déjà été traite mais je n'ai pas trouve de solutions et pourtant je pense que c'est un problème réccurent!
-
Salut,
Connaissez vous cela:
1.Il faut installer blast. sous ubuntu cela est très simple:
sudo apt-get install blast2
2. Il faut formater la base de donnée:
formatdb -i <fichier base de donnée> (si la base est protéique) et formatdb -i <fichier base de donnée> -pF #(si la base est nucléique)
3. Lancer blast:
blastall -p blastp -i <fichier séquences> -d <fichier database> -o <fichier output> .
A+
-
en effet faire ton blast en local sera plus rapide, n'oublie pas de préciser ton nombre de processeurs avec l'option "-a".
De plus si tu es équipé d'un GPU (carte graphique) de type nVidia et que cette carte possède CUDA, tu peux gagner un temps certain ! ;)