IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

Cherche programme pour effectuer de multiples alignements (pas d'alignement multiple!)


Sujet :

Bioinformatique Perl

  1. #1
    Futur Membre du Club
    Profil pro
    Étudiant
    Inscrit en
    Mai 2010
    Messages
    5
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2010
    Messages : 5
    Points : 5
    Points
    5
    Par défaut Cherche programme pour effectuer de multiples alignements (pas d'alignement multiple!)
    Bonjour,

    Je recherche un programme qui pourrait me permettre d'aligner 2 à 2 toutes les protéines d'une base de donnée contre une autre.
    Ces 2 bases de données sont définies localement (de l'ordre de quelques milliers de protéines sous forme de séquences FASTA pour chaque base).

    En output, il me faudrait une matrice du genre:

    .............| protéines espèce 2
    ---------+--------------------------
    protéines |
    espèce 1 | % d'identités ou similarité
    ________|

    Il s'agit donc de faire de multiples alignement (et non un alignement multiple) et il semble fastidieux de trouver un programme pouvant effectuer cette tâche.

    Il semble que le labo où je fais mon mémoire aie eu l'usage de BlastStation par le passé mais vu le coût de la license, ils ne sont pas enclins à renouveler l'expérience. Aussi, la version gratuite ne permet que de travailler sur 10 séquences FASTA à la fois, ce qui ne serait pas du tout gérable vu l'information à traiter (exercice à répéter au moins 36 fois !).

    Pouvez-vous m'aider à trouver un programme pouvant m'assister pour cette tâche? De préférence d'accès libre bien sur!

    (A priori, ils ne seraient pas friands que j'aie à coder moi-même un script pour cela, je n'ai d'ailleurs aucune expérience pour se faire, mais auquel cas, cela vous semble-t-il faisable dans un délai raisonnable pour une débutante?)

    D'avance merci,

    Cecolympe

  2. #2
    Membre confirmé Avatar de Beniou
    Homme Profil pro
    Inscrit en
    Novembre 2009
    Messages
    357
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Nord (Nord Pas de Calais)

    Informations forums :
    Inscription : Novembre 2009
    Messages : 357
    Points : 515
    Points
    515
    Par défaut
    Bonjour,

    Pourquoi ne pas utiliser directement blast (blastp) du NCBI ? (directement en ligne de commande ou via Bioperl).

    Tu as deux bases de quelques milliers de protéines donc cela fait pas mal de comparaisons 2 à 2 mais des protéines ne sont pas très grandes donc cela va relativement vite. De plus, si tu as plusieurs ordis/coeurs ... Tu pourrais lancer automatiquement la comparaison 2 à 2 en parsant ensuite les résultats et les présenter comme tu le souhaites sous forme de matrice de pourcentage de similarité.
    Je n'arrive pas à estimer le temps nécessaire non plus (plus à répéter 36 fois ??)

    Mais peut être que je n'ai pas compris ton problème...

    Pour blaststation, je ne le connaissais même pas et pourtant j'ai déjà travaillé dans de l'alignement de séquences...

    Sinon, pour toi de faire un script de comparaison de séquence, ce n'est pas jouable car cela repose sur des notions d'algorithmie et d'heuristiques précises... En plus il y a des outils qui le font très bien donc pourquoi se priver ?

  3. #3
    Futur Membre du Club
    Profil pro
    Étudiant
    Inscrit en
    Mai 2010
    Messages
    5
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2010
    Messages : 5
    Points : 5
    Points
    5
    Par défaut
    J'étais effectivement arrivée à l'outil proposé par NCBI dans ma recherche en attente de réponse...

    Je parlais de faire 36 fois l'analyse car j'ai 9 bases à comparer deux à deux

    Le problème que je présentait n'était pas vraiment le temps d'analyse, mais surtout que je ne peux me permettre de lancer manuellement chacun des alignements, ni par 10, 100!
    1000 à la fois serait un minimum!

    Je vais donc essayer de comprendre comment marche l'outil blastp en invite de commande, le cours de bioinformatique que j'ai eu se limitait principalement à du clic-bouton sur le web... J'ai quelques notions de programmation de base, mais bon, à voir si ça peut servir. Quand j'ai envisagé mon mémoire en bioinfo, j'avais pensé me former en perl, bioperl, mais il semble que mon promoteur aie d'autres projets pour moi.

    Je reviendrai par ici si je ne m'en sors pas

    Merci pour ta réponse!

  4. #4
    Membre confirmé Avatar de Beniou
    Homme Profil pro
    Inscrit en
    Novembre 2009
    Messages
    357
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Nord (Nord Pas de Calais)

    Informations forums :
    Inscription : Novembre 2009
    Messages : 357
    Points : 515
    Points
    515
    Par défaut
    Pou automatiser tes différents blast, il y a plusieurs méthodes dont appeler les blast dans un script perl (en utilisant ou pas Bioperl) qui va simplement gérer les appels au programme sur les bonnes séquences, récupérer les sorties du programme et formater les résultats.
    Ensuite tu peux faire cela dans n'importe quel langage (shell, etc.)

    A toi de voir au mieux suivant tes compétences.

  5. #5
    Futur Membre du Club
    Profil pro
    Étudiant
    Inscrit en
    Mai 2010
    Messages
    5
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2010
    Messages : 5
    Points : 5
    Points
    5
    Par défaut
    Mes compétences...à peu près nulles pour le moment, ça doit changer!

    Tout ce que j'ai fait concrètement en programmation c'est du html/php, du Matlab et j'ai lu quelques tutos d'introduction en C et Perl.

    Et les invites de commandes...ben en regardant un peu comment fonctionnait blast+ de NCBI, j'en suis toujours si non nulle part, pas très loin. J'ai honte d'avouer que j'y comprend pas grand chose!

    Bon, en cherchant un peu (beaucoup), j'ai trouvé les différentes application dont blastp, j'ai réussi à en consulter l'aide avec l'invite de commande...mais de là à voir comment je vais bien pouvoir les appeler et automatiser tout ça...j'vais devoir encore un peu beaucoup potasser je crois.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 2
    Dernier message: 06/04/2013, 11h53
  2. Cherche librairie pour gérer un fichier XML (pas un parser)
    Par batataw dans le forum Format d'échange (XML, JSON...)
    Réponses: 2
    Dernier message: 20/10/2007, 23h18
  3. Cherche programme pour limiter bande passante sur connexion internet partagée
    Par frechy dans le forum Dépannage et Assistance
    Réponses: 4
    Dernier message: 11/05/2006, 23h02
  4. Réponses: 7
    Dernier message: 27/04/2006, 14h51
  5. Réponses: 19
    Dernier message: 26/12/2005, 01h04

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo