IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

Query coverage && Max identity


Sujet :

Bioinformatique Perl

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Octobre 2009
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations forums :
    Inscription : Octobre 2009
    Messages : 22
    Par défaut
    Bonjour

    Après une recherche sur blast, je dois récupérer le hit avec un query coverage=100 ET un max identity =100

    j'effectue 2 recherche une sur NCBI et l'autre sur une BD locale avec bl2seq.

    Est ce que c'est la même approche dans les 2 cas?
    Quelqu'un aurai une idée de comment faire?

    Merci

  2. #2
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    Je ne sais pas si il existe plus simple, mais je fais comme suit :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    while ( my $hit_bis = $result->next_hit ) {
    	next unless ( $v > 0);
     
    	while( my $hsp = $hit_bis->next_hsp ) {
     
    		#---------------------------------------
    		# voir Bio::Search::HSP::GenericHSP
    		#---------------------------------------
     
    		# Returns a SeqFeature representing the query in the HSP
    		# Bio::SeqFeature::Similarity
    		my $query = $hsp->query;
     
    		# Returns a SeqFeature representing the hit in the HSP
    		# Bio::SeqFeature::Similarity
    		my $hit = $hsp->hit;
     
    		my $query_start = $query->location->{'_start'};
    		my $query_end = $query->location->{'_end'};
    		my $query_length = $query_end - $query_start + 1;
    		my $query_cover = ($query_length/$query_tot_length) * 100;						
     
    		my $percentid = $hsp->percent_identity();
    	}
    }
    Avec $query_tot_length étant la longueur de ta séquence passée au blast et $query_length la portion alignée.

    Pour ce qui est de l'identité maximale, veux-tu dire pour un hit l'hsp avec l'identité maximale? Si oui, il te suffit de garder en mémoire la liste des pourcentages par hit et de prendre le plus haut.

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Octobre 2009
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations forums :
    Inscription : Octobre 2009
    Messages : 22
    Par défaut
    en alignement local avec lb2seq, est-ce qu'on peut modulé l'alignement? autorisé des alignements non parfaits?

    Mes séquences sont très petites (20 a 30 nucléotides), quand je blast contre mon génome il ne retrouve aucun alignement, ce qui n'est pas normal...

  4. #4
    Membre chevronné Avatar de Beniou
    Homme Profil pro
    Inscrit en
    Novembre 2009
    Messages
    357
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : France, Nord (Nord Pas de Calais)

    Informations forums :
    Inscription : Novembre 2009
    Messages : 357
    Par défaut
    Citation Envoyé par Bioinfoe
    Mes séquences sont très petites (20 a 30 nucléotides), quand je blast contre mon génome il ne retrouve aucun alignement, ce qui n'est pas normal...
    Précise un peu : il ne retrouve rien de significatif ou rien du tout ? Parce que 20-30 nucléotide contre un génome... La pvalue ne va pas être élevée vu que par chance tu peux retrouver facilement 20-30 nucléotide sur un génome entier (que ce soit procaryote ou eucaryote).

    Quel longueur de mot utilises-tu pour ta recherche blast et ton seuil "expect threshold" ?

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Octobre 2009
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations forums :
    Inscription : Octobre 2009
    Messages : 22
    Par défaut
    j'ai trouvé mon problème : fallait que je change la valeur du Word Size vu que mes séquences sont courtes

    Merci Jasmine, ça marche

+ Répondre à la discussion
Cette discussion est résolue.

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo