IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

extraction d'information de resultat du BLAST


Sujet :

Bioinformatique Perl

  1. #1
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    44
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 44
    Points : 32
    Points
    32
    Par défaut extraction d'information de resultat du BLAST
    Bonjour à tous,

    j'ai utilisé le software BLAST. Le résultat est un fichier qui contient plusieurs oligo (Query) et les séquences dans la base de données pour lesquelles le "Query" mache. Comme vous savez, pour chaque oligo le Blast donne beaucoup d'informations.

    Merci de m'aider comment extraire à partir de fichier de résultat, pour chaque "Query" , les informations comme: NOM de "Query", et NOM des séquences pour lesquelles le "Query" matche 100%.

    Par example, au dessous est l'information d'un Oligo qui matche 100% dans 3 séquences Sf2M12141-3-1 , Sf1P10720-5-1, Sf1P24066-5-1. Je voudrais extraire seulement le NOM de Query et NOM de ces séquences (Sf2M12141-3-1 , Sf1P10720-5-1, Sf1P24066-5-1).


    Merci en avance!


    --------------------------------------------------
    BLASTN 2.2.18 [Mar-02-2008]


    Reference: Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer,
    Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997),
    "Gapped BLAST and PSI-BLAST: a new generation of protein database search
    programs", Nucleic Acids Res. 25:3389-3402.

    Query= A1 S2_384_001 >2J11-SP6\G
    (60 letters)

    Database: myEST.fasta
    79,148 sequences; 45,507,970 total letters

    Searching..................................................done



    Score E
    Sequences producing significant alignments: (bits) Value

    Sf2M12141-3-1 119 2e-027
    Sf1P10720-5-1 119 2e-027
    Sf1P24066-5-1 119 2e-027

    >Sf2M12141-3-1
    Length = 734

    Score = 119 bits (60), Expect = 2e-027
    Identities = 60/60 (100%)
    Strand = Plus / Plus


    Query: 1 gataccagcgggatcattatgccacattctgatcttggacctgcattatagatctgactt 60
    ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
    Sbjct: 306 gataccagcgggatcattatgccacattctgatcttggacctgcattatagatctgactt 365


    >Sf1P10720-5-1
    Length = 661

    Score = 119 bits (60), Expect = 2e-027
    Identities = 60/60 (100%)
    Strand = Plus / Plus


    Query: 1 gataccagcgggatcattatgccacattctgatcttggacctgcattatagatctgactt 60
    ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
    Sbjct: 208 gataccagcgggatcattatgccacattctgatcttggacctgcattatagatctgactt 267


    >Sf1P24066-5-1
    Length = 687

    Score = 119 bits (60), Expect = 2e-027
    Identities = 60/60 (100%)
    Strand = Plus / Plus


    Query: 1 gataccagcgggatcattatgccacattctgatcttggacctgcattatagatctgactt 60
    ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
    Sbjct: 588 gataccagcgggatcattatgccacattctgatcttggacctgcattatagatctgactt 647
    -----------------------

  2. #2
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Voici un de mes scripts qui pourrait t'aiguiller
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    #-------------------------------------- BoulderBlast.pl --------------------------------------#
    #  Récupère et affiche à l'écran les informations d'un fichier blast
    #       Query            query sequence
    #       Subject          subject sequence
    #       Identity         percent identity of the hit
    #       Expect           expectation value for the hit
    #       Length           aligned sequences length
    #-------------------------------------- BoulderBlast.pl --------------------------------------#
     
    use strict;
    use warnings;
    use Boulder::Blast;
     
    # parse and read a set of blast output files
    my $blast = Boulder::Blast->parse("P:/Perl/scripts2/Files/Blast_Result.blast");
     
    # once you have a $blast object, you can get info about it:
    my $query = $blast->Blast_query;
    my @hits  = $blast->Blast_hits;
    foreach my $hit (@hits)
    {
            my $hit_sequence = $hit->Name;    # get the ID
            my $significance = $hit->Signif;  # get the significance
            my @hsps = $hit->Hsps;            # list of HSPs
            foreach my $hsp (@hsps)
            {
                    my $query   = $hsp->Query;              # query sequence
                    my $subject = $hsp->Subject;            # subject sequence
                    my $Identity  = $hsp->Identity;         # percent identity of the hit
                    my $Expect = $hsp->Expect;              # expectation value for the hit
                    my $length  = $hsp->Length;             # aligned sequences length
     
                    print "QUERY : $query\n";
                    print "SUBJECT : $subject\n";
                    print "IDENTITY :$Identity\n";
                    print "EXPECT : $Expect\n";
                    print "LENGTH : $length\n";
            }
    }

    http://search.cpan.org/~lds/Boulder-...ulder/Blast.pm

    The Boulder::Blast class parses the output of the Washington University (WU) or National Cenber for Biotechnology Information (NCBI) series of BLAST programs and turns them into Stone records. You may then use the standard Stone access methods to retrieve information about the BLAST run, or add the information to a Boulder stream.
    -- Jasmine --

  3. #3
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    44
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 44
    Points : 32
    Points
    32
    Par défaut
    Merci pour ta réponse et ton script!

    Mais il y a une erreur comme suivante :

    can't locate Bouder/Blast.pm in @INC contains: C:/Program Files/Perl/lib/site

    Je trouve le fichier Blast.pm dans répertoire:

    C:\Program Files\Perl\site\lib\Bio\Index

    Comment je dois faire?

    Merci!

Discussions similaires

  1. Extraction d'informations à partir d'un fichier
    Par narmika dans le forum Langage
    Réponses: 7
    Dernier message: 26/09/2007, 13h45
  2. Réponses: 1
    Dernier message: 10/04/2007, 23h53
  3. extraction d'informations conditionnelle
    Par raboliot dans le forum Langage SQL
    Réponses: 3
    Dernier message: 30/03/2007, 10h39
  4. [XSLT][PHP] Extraction d'informations d'un XML
    Par H¤N£y dans le forum XSL/XSLT/XPATH
    Réponses: 3
    Dernier message: 10/12/2006, 10h05
  5. Extraction d'informations
    Par sam.fet dans le forum Linux
    Réponses: 2
    Dernier message: 15/06/2006, 17h18

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo