IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

récupération du score de similitude entre deux séquences avec ClustalW2


Sujet :

Bioinformatique Perl

  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Novembre 2008
    Messages
    6
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2008
    Messages : 6
    Points : 5
    Points
    5
    Par défaut récupération du score de similitude entre deux séquences avec ClustalW2
    Bonjour,
    je voulais savoir comment on peut récupérer dans un fichier de sortie le pourcentage de similitude entre deux séquences de protéines avec le programme ClustalW2 téléchargé à l'adresse suivante : http://www.ebi.ac.uk/Tools/clustalw2/index.html .
    Est-ce que quelqu'un pourrait m'indiquer quel choix (avec les commandes en chiffre) prendre dans le menu pour obtenir le score?
    Merci beaucoup.
    Aline70

  2. #2
    Membre confirmé
    Avatar de MaliciaR
    Inscrit en
    Juillet 2008
    Messages
    513
    Détails du profil
    Informations personnelles :
    Âge : 41

    Informations forums :
    Inscription : Juillet 2008
    Messages : 513
    Points : 600
    Points
    600
    Par défaut
    Salut et bienvenue

    J'ai une question : pourquoi choisir un logiciel d'alignement multiple pour faire l'alignement de 2 séquences? De même, on ne peut absolument pas te dire quelles valeurs mettre : ça dépend de la question que tu poses au départ
    Si tu veux, donne-nous un peu plus d'infos et on essayera de t'aider au mieux.
    Le tact dans l'audace c'est de savoir jusqu'où on peut aller trop loin. Cocteau
    L'abjection la plus totale, ce n'est pas de trahir, c'est de ne jamais donner un commencement de réalité à ses rêves les plus fous. M. Moreau


    Les indispensables : Les règles, , FAQ et tutos avant de poster, et !
    Traduction de Linux Device Drivers 3 : venez participer
    membre de l'April - Promouvoir et défendre les logiciels libres

  3. #3
    Futur Membre du Club
    Profil pro
    Inscrit en
    Novembre 2008
    Messages
    6
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2008
    Messages : 6
    Points : 5
    Points
    5
    Par défaut
    Merci de m'avoir répondu et de vouloir m'aider...En faite je voudrais obtenir le pourcentage de similitude entre deux séquences protéiques dans un fichier multifasta. Pour cela je pensais utiliser ClustalW2 car apparemment ce logiciel peut effectuer un alignement seulement avec deux séquences...Le seul problème c'est que j'ai pas trouvé comment il le fait!!
    En gros j ai un fichier fasta de la sorte :

    >prot1 | taille1
    AFPKLRGSWAALLMMTTTAT
    RGSWAAGGSWAWAWAMTG
    >prot2 | taille2
    AFPKLRSWAALLMTTTTATT
    GSWAGGSWAWAWWWMM

    ClustalW2 doit pouvoir me prendre ce fichier et me faire l'alignement des deux séquences et donc ensuite j aimerai qu'il me donne un fichier où je puisse récupérer le score entre ces deux séquences. Car c'est ce score que j'ai besoin par la suite...
    Voila j'espère que c'est plus clair...Encore merci pour l'aide!!
    Aline70

  4. #4
    Membre confirmé
    Avatar de MaliciaR
    Inscrit en
    Juillet 2008
    Messages
    513
    Détails du profil
    Informations personnelles :
    Âge : 41

    Informations forums :
    Inscription : Juillet 2008
    Messages : 513
    Points : 600
    Points
    600
    Par défaut
    Salut,

    Citation Envoyé par aline70 Voir le message
    Merci de m'avoir répondu et de vouloir m'aider...En faite je voudrais obtenir le pourcentage de similitude entre deux séquences protéiques dans un fichier multifasta.
    J'ai compris ce que tu recherchais En revanche, le fichier multifasta, j'connais pas Tu veux dire que tu vas donner au logiciel des séquences au format fasta et tu voudras une sortie contenant les scores.


    Citation Envoyé par aline70 Voir le message
    Pour cela je pensais utiliser ClustalW2 car apparemment ce logiciel peut effectuer un alignement seulement avec deux séquences...Le seul problème c'est que j'ai pas trouvé comment il le fait!!
    En gros j ai un fichier fasta de la sorte :

    >prot1 | taille1
    AFPKLRGSWAALLMMTTTAT
    RGSWAAGGSWAWAWAMTG
    >prot2 | taille2
    AFPKLRSWAALLMTTTTATT
    GSWAGGSWAWAWWWMM
    Donc, ClustalW2 est un logiciel d'alignement multiple, càd de plus de 2 séquences. Si tu veux faire de l'alignement de 2 séquences, tu peux utiliser bl2seq (c'est un algo de NCBI) ou needle. Le truc est que tu dois utiliser le logiciel selon la question que tu poses. En fait, BLAST fait de l'alignement local (il trouve les meilleures correspondances localement) alors que needle fait de l'alignement global (cherche à trouver comment faire correspondre les deux séquences sur leur totalité). ClustalW fait de l'alignement global aussi. C'est à prendre en compte pour savoir si c'est approprié à ce que tu cherches Tu peux l'utiliser pour un alignement de 2 séquences, mais si tu considères que son algo y est adapté.
    Alors, tu as des endroits pour rentrer tes séquences. Tu les rentres dans le format FASTA (comme tu les as indiquées ici) et ensuite, tu ajustes les fameux critères.


    Citation Envoyé par aline70 Voir le message
    ClustalW2 doit pouvoir me prendre ce fichier et me faire l'alignement des deux séquences et donc ensuite j aimerai qu'il me donne un fichier où je puisse récupérer le score entre ces deux séquences. Car c'est ce score que j'ai besoin par la suite...
    Voila j'espère que c'est plus clair...Encore merci pour l'aide!!
    Aline70
    Beh quand il aura fini de bosser, il te sort des fichiers de résultats. Si je ne trompe, Clustal sort et un fichier .txt, et un fichier .html, donc y a de quoi faire. Mais attention à ce que tu récupères comme résultats : pense à bien jouer avec les différents paramètres d'alignement et à choisir le bon outil, sinon tu te retrouveras avec un truc pas forcément valable pour ta question biologique.

    N'hésite pas si tu as d'autres questions
    Le tact dans l'audace c'est de savoir jusqu'où on peut aller trop loin. Cocteau
    L'abjection la plus totale, ce n'est pas de trahir, c'est de ne jamais donner un commencement de réalité à ses rêves les plus fous. M. Moreau


    Les indispensables : Les règles, , FAQ et tutos avant de poster, et !
    Traduction de Linux Device Drivers 3 : venez participer
    membre de l'April - Promouvoir et défendre les logiciels libres

  5. #5
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Coucou,


    Pour ce qui est de répondre à ta question
    Envoyé par aline70 Voir le message
    ClustalW2 doit pouvoir me prendre ce fichier et me faire l'alignement des deux séquences et donc ensuite j aimerai qu'il me donne un fichier où je puisse récupérer le score entre ces deux séquences. Car c'est ce score que j'ai besoin par la suite...
    Tu peux dévier la sortie à l'écran dans un fichier texte :
    http://www.developpez.net/forums/d57...crire-fichier/


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    #!/usr/local/bin/perl
     
    use strict;
    use Bio::Tools::Run::Alignment::Clustalw;
     
     
    close STDOUT;
    open STDOUT, '>', "P:/Perl/scripts2/Files/test_score.txt"
      or die "...";
     
     
    my $file = "P:/Perl/scripts2/Files/test.txt";
    my $out_file = "P:/Perl/scripts2/Files/test_ali.fsa";
    my @params = ('ktuple' => 2, 'matrix' => 'BLOSUM',  'outfile' => $out_file,);
     
    my $factory = Bio::Tools::Run::Alignment::Clustalw->new(@params);
     
    $factory->executable("C:/Clustalw/clustalw2.exe");
    my $aln = $factory->align($file);
    Voici ce que je j'obtiens avec tes 2 protéines (fichier test_score.txt)
    CLUSTAL W 2.0 Multiple Sequence Alignments


    Sequence format is Pearson
    number of seqs is: 2
    Sequence 1: prot1 38 aa
    Sequence 2: prot2 36 aa

    Start of Pairwise alignments

    Aligning...

    Sequences (1:2) Aligned. Score: 83
    Guide tree file created: [D:\DOCUME~1\Minguet\LOCALS~1\Temp\KYYk5CQ0Ct\55mtbzi9Tb.dnd]

    Guide tree file created: [D:\DOCUME~1\Minguet\LOCALS~1\Temp\KYYk5CQ0Ct\55mtbzi9Tb.dnd]
    There are 1 groups
    Start of Multiple Alignment

    Aligning...
    Group 1: Sequences: 2 Score:474
    Alignment Score -16
    Sequences (1:2) Aligned. Score: 83
    83 est-il bien le score que tu veux récupérer?
    -- Jasmine --

  6. #6
    Futur Membre du Club
    Profil pro
    Inscrit en
    Novembre 2008
    Messages
    6
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2008
    Messages : 6
    Points : 5
    Points
    5
    Par défaut réponse
    Oui, en faite j'avais réussi à le faire j'ai fais exactement cette méthode car c'est la seule qui m'était venue à l'esprit et comme ça marchait je l'ai laissé comme ça. C'est un peu long car si je fais ça avec un jeu de séquences plus important ça ralenti ...Mais bon ça marche!!!Du coup avec ça j'ai pu récupérer même les deux noms des deux séquences et leur taille donc c'était plutôt sympa!!!et utiliser enfin mes scores
    Donc je vous remercie de m'avoir aider ... Merci beaucoup

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [1.x] Récupération enregistrements d'un relations entre deux tables
    Par mixka13 dans le forum Symfony
    Réponses: 4
    Dernier message: 30/05/2011, 18h19
  2. Calcul de similitude entre deux collections
    Par Molos dans le forum Algorithmes et structures de données
    Réponses: 2
    Dernier message: 09/05/2009, 12h46
  3. Réponses: 26
    Dernier message: 21/01/2009, 09h32
  4. calcul délais entre deux dates avec plages horaires
    Par leila eco dans le forum SAP Crystal Reports
    Réponses: 3
    Dernier message: 03/01/2007, 17h51
  5. Réponses: 1
    Dernier message: 05/10/2006, 05h20

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo