IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

Script BLAST sur une DB local ou NCBI


Sujet :

Bioinformatique Perl

  1. #1
    Candidat au Club
    Inscrit en
    Juin 2010
    Messages
    2
    Détails du profil
    Informations forums :
    Inscription : Juin 2010
    Messages : 2
    Points : 2
    Points
    2
    Par défaut Script BLAST sur une DB local ou NCBI
    Deja bonjour a tous, je suis nouveau sur le forum mais je le parcours depuis quelques temps et il m'a deja beaucoup aide.
    Je vous presente donc mon probleme (qui n'en est pas vraiment un mais plutot une demande de marche a suivre )

    Je suis actuellement en stage dans une boite de bio mol en Chine et niveau automatisation du traitement de leurs séquences c'est zero. Pour l'instant ils ont une liste de fichiers avec les sequences qu'ils ont deja traites.

    Mon job est de creer une database local avec toutes ces sequences puis quand ils recoivent une nouvelle sequence a synthetiser d un client,faire un programme perl qui BLAST cette sequence avec la base de donnee local pour voir si cette sequence a deja ete traitee auparavant, si elle l a ete en extraire les donnes de database local sinon lancer un BLAST sur la DB NCBI sur le web.

    Voila je ne sais pas si c'est tres clair j'ai essaye de faire de mon mieux, je debute un peu en programmation perl mais j'ai deja l'habitude du C,C++ et autres Java
    J'aurais voulu des conseils sur la marche suivre et sur les modules a utiliser.
    J'ai aussi vu qu il y avait un module qui permettait de compiler des scripts perl pour en faire un executable utilisable sur toutes les machines ?

    Merci d'avance pour les reponses et excusez moi pour le peu de lisibilite je suis sur un clavier chinois

  2. #2
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Tu dois créer ta DB local Blast à partir d'un fichier fasta

    Module Bio::Tools::Run::StandAloneBlast - Object for the local execution of the NCBI BLAST program suite (blastall, blastpgp, bl2seq). There is experimental support for WU-Blast and NCBI rpsblast.


    Je vais regarder dans mes programmes et essayer de trouver celui qui se rapproche le plus de ce dont tu as besoin

  3. #3
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    #------------------  Programme DBblast_create.pl
     
    chdir('C:/BLAST/bin');
     
    my $fasta_file = 'chemin/sequences.txt';
    my $blast_db = 'chemin/test_BlastDB';
     
     
    system "formatdb -p F -i $fasta_file -n $blast_db" or print $!;
    Tu dois au préalable créer ta DB blast. Soit via ce petit script, soit directement via la console. Regarde dans la documentation de Blast pour plus d'informations sur cette commande.

  4. #4
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Voici un script qui devrait t'aider


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    135
    136
    137
    138
    139
    140
    141
    142
    143
    144
    145
    146
    147
    148
    149
    150
    151
    152
    153
    154
    155
    156
    157
    158
    159
    160
    161
    162
    163
    164
    165
    166
    167
    168
    169
    170
    171
    172
    173
    174
    175
    176
    177
    178
    179
    180
    181
    182
    183
    184
    185
    186
    187
    188
    189
    190
    191
    192
    193
    194
    195
    196
    197
    198
    199
    200
    201
    #!/usr/local/bin/perl
     
     
     
    #-------------------------------------- BLAST_FungiDB.pl --------------------------------------#
     
    # Prend en entrée une séquence qu'il blaste sur une de nos bases de données locales
     
    #-------------------------------------- BLAST_FungiDB.pl --------------------------------------#
     
     
     
    =h
     
     
     
    In BioPerl, the BLAST application can be run using Bio::Tools::Run::StandAloneBlast, and output parsed using Bio::SearchIO.
     
     
     
     
     
    Before running StandAloneBlast it is necessary: to install BLAST
     
    on your system, to edit set the environmental variable $BLASTDIR
     
    or your $PATH variable to point to the BLAST directory, and to
     
    ensure that users have execute privileges for the BLAST program.
     
    If the databases which will be searched by BLAST are located in the
     
    data subdirectory of the blast program directory (the default
     
    installation location), StandAloneBlast will find them; however,
     
    if the database files are located in any other location, environmental
     
    variable $BLASTDATADIR will need to be set to point to that directory.
     
     
     
    The database specified must first be formatted with formatdb.
     
    Multiple database names (bracketed by quotations) will be accepted.
     
     
     
    -------------------------------------------------------------------------------------------------------
     
    http://www.molbiol.ox.ac.uk/analysis_tools/BLAST/formatdb.shtml
     
     
     
    The following arguments are used with formatdb:
     
     
     
    -i name of the input file
     
    -p type of BLAST database
     
    T protein (default)
     
    F nucleotide
     
     
     
    -n name of the BLAST index that you are about to create
     
    In the following example, formatdb is used to construct a BLAST database called "customBLASTdb" from a fasta file called "all_seqs.fasta" containing multiple nucleotide sequences:
     
     
     
    formatdb -p F -i all_seqs.fasta -n customBLASTdb
     
     
     
    -------------------------------------------------------------------------------------------------------
     
    http://www.people.vcu.edu/~elhaij/IntroBioinf/Links/RunLocalBlast.html
     
     
     
    1. Create a database of E. coli K12 protein
     
     
     
    a. Get into a Dos window (Run Command or Cmd)     DANS BLAST\bin
     
     
     
    b. Get into the directory where Blast and the FA files reside (CD \Blast)
     
     
     
    c. Type the following command to format the database:
     
     
     
    DANS BLAST\bin
     
        formatdb -p F -i fichiers.fa -n NomBLASTdb
     
     
     
     
     
    =cut
     
     
     
     
     
     
     
     
     
     
     
    =h
     
    CREATION DE BASE DE DONNES POUR BLAST
     
    via la console, aller dans le répertoire où se trouve allblast.exe
     
    écrire la commande formatdb -p F -i chemin/fichiers.fa -n chemin/NomBLASTdb
     
    =cut
     
     
     
     
     
     
     
    use strict;
     
    use warnings;
     
    use Time::localtime;
     
    use Bio::Tools::Run::StandAloneBlast;
     
     
     
    my $Depart = ctime();
     
     
     
    # chemin vers les bases de données
     
    my $Chemin = "P:/Perl/scripts/Files/FungiDB";
     
     
     
     
     
     
     
    # Parametres
     
    my $program = "blastn";
     
    my $BLASTdb = "BipolarisBLASTdb";
     
    my $Executable = "blastall";
     
    my $input = Bio::Seq->new(-id=>"test1",-seq=>"TGGTGTTGGGCGTTTTTTTGTCTTGCTGCAAGCAAGACTCGCCTTAAAACGATTGGCAGCCGGCCTACTGGTTTCGGAGCGCAGCACATTTTTTGCGCTTGCAACCAGCAAAAGAGGTTGGCGATC");
     
    my $Fich_Sortie = "TestBipolaris";
     
     
     
     
     
     
     
    my @params = ('program' => $program , 'database' => "$Chemin/DB/$BLASTdb");
     
    my $factory = Bio::Tools::Run::StandAloneBlast->new(@params);
     
    $factory->outfile("$Chemin/BLAST/$Fich_Sortie".".blast");
     
    $factory->executable($Executable, "C:/BLAST/bin/$Executable.exe");
     
    my $bl2seq_report = $factory->blastall($input);
     
     
     
     
     
     
     
    #BILAN
     
    #------
     
    my $Fin = ctime();
     
    print "\nDepart : $Depart\nFin : $Fin\n";

  5. #5
    Candidat au Club
    Inscrit en
    Juin 2010
    Messages
    2
    Détails du profil
    Informations forums :
    Inscription : Juin 2010
    Messages : 2
    Points : 2
    Points
    2
    Par défaut
    Merci Jasmine pour ces réponses, j'ai depuis réussi a faire quelque chose qui tiens la route je pense, même si je pense que mon code est un peu brouillon et manque de commentaires

    Je me suis inspire de beaucoup de petits bouts de codes a l'aide du forum.
    Je poste mon code si ca peut intéresser quelqu'un même si il n'est pas très très abouti il marche
    Maintenant il faut que je me lance dans une interface web donc je vais me renseigner sur le module CGI voir ce que je peux faire avec.
    Encore merci !


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
     
    #C:/Perl/
    use warnings;
    use strict;
    use Time::localtime;
     
    use Bio::Tools::Run::StandAloneBlast;
    use Bio::Tools::Run::RemoteBlast;
    use Bio::SearchIO;
     
    my $start= ctime();
    my $path = 'C:/blast_tools/bin/';
    my $fasta_file= 'seq.txt';
    my $blastDB_file = 'DB';
    my $v = 1;
     
    my $path_bin = 'C:\blast_tools\bin';
    chdir($path_bin);
    system("formatdb -p F -i $path"."$fasta_file -n $path"."$blastDB_file")   and warn "$!";
     
    my $path_work = 'C:\Perl\Perl IDE';
    chdir($path_work);
     
    print "OK\n";
     
     
    my $input = Bio::Seq->new(-id=>'input_seq',-seq=>"ATGCTAGTAGCTAGCTAGCATGCTAGTAGCTCGAGCATGCTACGA");
    my $output_file = 'Test_ITS.bls';
    my @params = ('program' => 'blastn' , 'database' => $path.$blastDB_file, e => '1e-3', W => '5');
    my $factory = Bio::Tools::Run::StandAloneBlast->new(@params);
    $factory->outfile($path.$output_file);
    $factory->executable('blastall', 'C:/blast_tools/bin/blastall.exe');
    my $bl2seq_report = $factory->blastall($input);
     
    my $blast_report = new Bio::SearchIO(-format => 'blast',
                                         -file   => 'C:/Blast_tools/bin/Test_ITS.bls');
     
    my $result = $blast_report->next_result;
     
    while( my $hit = $result->next_hit()) {
      print "hit name: ", $hit->name(), "\n";
      while( my $hsp = $hit->next_hsp()) {
        print "E: ", $hsp->evalue(), " frac_identical: ",	$hsp->frac_identical(), "\n";
        die "Sequence found";
        }
      }
     
     
    #declaration et initialisation des variables
    my $prog = 'blastn';
    my $db   = 'nr';
    my $e_val= '1e-10';
     
     
    #des parametres
    my @paramsweb = (
        '-prog' => $prog,
        '-data' => $db,
        '-expect' => $e_val,
        '-readmethod' => 'SearchIO');
     
    my $factoryweb = Bio::Tools::Run::RemoteBlast->new(@paramsweb);
    my $seq_blast = Bio::SeqIO ->new (-file =>"C:/Blast_tools/bin/NM_001701.txt",
                                      -format =>'fasta');
    while (my $input = $seq_blast -> next_seq()){
     
    	my $r = $factoryweb->submit_blast($input);
      print STDERR "Sequence not found in the local database, BLAST one the web database...\n" ;
    	print STDERR "waiting..." if( $v > 0 );
     
    	while ( my @rids = $factoryweb->each_rid ) {
     
    		foreach my $rid ( @rids ) {
     
    			my $rc = $factoryweb->retrieve_blast($rid);
     
    			if( !ref($rc) ) {
    				if( $rc < 0 ) {
    					$factoryweb->remove_rid($rid);
    				}
    				print STDERR "." if ( $v > 0 );
    				sleep 5;
    			}
     
    			else {
    				my $result = $rc->next_result();
     
    				#save the output
    				my $filename = 'C:/Blast_tools/bin/resultat_blast.bls';
    				$factoryweb->save_output($filename);
    				$factoryweb->remove_rid($rid);
    			}
    		}
    	}
    }
     
    my $inweb = new Bio::SearchIO(-format => 'blast',
                               -file   => 'C:/Blast_tools/bin/resultat_blast.bls');
     
    $result = $inweb->next_result;
      ## $result is a Bio::Search::Result::ResultI compliant object
    my $hit = $result->next_hit ;
        ## $hit is a Bio::Search::Hit::HitI compliant object
    my $hsp = $hit->next_hsp ;
          ## $hsp is a Bio::Search::HSP::HSPI compliant object
          if( $hsp->length('total') > 50 ) {
            if ( $hsp->percent_identity >= 75 ) {
              print "Query=",   $result->query_name,
                " Hit=",        $hit->name,
                " Length=",     $hsp->length('total'),
                " Percent_id=", $hsp->percent_identity, "\n";
               }
            }

  6. #6
    Membre à l'essai
    Profil pro
    Inscrit en
    Juin 2010
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2010
    Messages : 22
    Points : 20
    Points
    20
    Par défaut
    Je suis également en problème avec l'analyse de résultats de blast, plus précisément lors du parsing des résultats.
    Certaines des query ne produisent pas de résultat de recherche de similarité, retournant dans le fichier de sortie de blast un "***** No hits found ******". Ceci est pour moi une information importante mais qui n'est pas parsée avec le script précédent car il ne prend en compte que les $result->next_hit.

    Est-il possible de retournée une valeur lorsqu'il n'y a pas de hit?

    Cordialement

  7. #7
    Membre confirmé Avatar de Beniou
    Homme Profil pro
    Inscrit en
    Novembre 2009
    Messages
    357
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Nord (Nord Pas de Calais)

    Informations forums :
    Inscription : Novembre 2009
    Messages : 357
    Points : 515
    Points
    515
    Par défaut
    Tu peux peut être géré ce cas particulier avec les fonctions num_hits et/ou no_hits_found

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    my $num_hits = $result->num_hits();
    ...
    if ($result->no_hits_found()){
      ...
    }

  8. #8
    Membre à l'essai
    Profil pro
    Inscrit en
    Juin 2010
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2010
    Messages : 22
    Points : 20
    Points
    20
    Par défaut
    Merci Beniou, cela fonctionne parfaitement

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Condition sur une variablr locale
    Par Gregory.M dans le forum Développement
    Réponses: 1
    Dernier message: 09/03/2009, 15h15
  2. Problème avec Blast sur serveur Apache local
    Par jobim08 dans le forum Apache
    Réponses: 6
    Dernier message: 20/02/2009, 10h19
  3. Réponses: 4
    Dernier message: 19/06/2007, 11h19
  4. Dernier script execute sur une base
    Par loupin dans le forum Administration
    Réponses: 2
    Dernier message: 23/05/2007, 10h06
  5. Exécuter un script perl sur une page HTML
    Par natie_49 dans le forum Web
    Réponses: 13
    Dernier message: 05/03/2007, 16h50

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo