IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

Débuter un projet de détermination de d'espèces


Sujet :

Bioinformatique Perl

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Juin 2011
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Vienne (Poitou Charente)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2011
    Messages : 4
    Par défaut Débuter un projet de détermination de d'espèces
    bonjour tous le monde

    Je suis étudiante en génie physiologique et informatique et je suis actuellement en stage au Etats Unis pour valider ma L3
    Mon sujet de stage a changé ,je dois maintenant créer un programme étant débutante en programmation je suis un peu perdu et je ne sais pas trop par quel bout commencer.



    Je vous explique un peu mon sujet ,je dois réaliser un programme qui à partir de séquence ADN (barcoding DNa)permet après un blast de savoir à quelles espèces ces séquences appartiennent et après regrouper le tout en statistique.
    Je pensais utiliser bioperl pour le blast et après utiliser R pour traduire mes données en statistique.
    Si quelqu'un peut m'eclairer un petit peu une fois que je serais lancer normalement ça devrait aller!!

  2. #2
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822
    Par défaut
    Tu as un maitre de stage avec qui tu peux discuter pour définir ton cahier des charges. Nous ne pouvons pas deviner et faire ce travail à ta place .

  3. #3
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    Citation Envoyé par marie.lefebvre1608 Voir le message
    Je pensais utiliser bioperl pour le blast et après utiliser R pour traduire mes données en statistique.
    Si quelqu'un peut m'eclairer un petit peu une fois que je serais lancer normalement ça devrait aller!!

    Bonjour Marie,

    Ton projet a-t-il bien avancé?

    Comme l'a souligné Djibril nous devrions en savoir plus afin de t'aider, voici néanmoins quelques pistes :

    Sous-quelle forme sont stockées tes séquences de départ? Une base de données, un fichier texte?

    Pour les statistiques si tu veux passer par perl, tu peux utiliser le module Statistics::R - Controls the R (R-project) interpreter through Perl.

    Pour les blast, tu peux utiliser le module Bio::Tools::Run::RemoteBlast - Object for remote execution of the NCBI Blast via HTTP. Ecris ton programme en te basant sur le synopsis. N'hésite pas à repasser sur le forum si tu es bloquée et que tu as une question précise. Pense aussi à la FAQ et aux tutoriels. Bon travail.

  4. #4
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Juin 2011
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Vienne (Poitou Charente)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2011
    Messages : 4
    Par défaut
    bonjour
    merci d'avoir pris le temps de me répondre.
    En passant quelques heures pour ne pas dire quelques jours j'ai reussi à bien demarrer mais etant complement novice en bioperl tout deviens vite compliqué
    J'ai reussi à utiliser remoteblast et à obtenir un rapport blast mais mon principal problème est que je n'arrive pas à extraire les informations taxonomiques de toutes les séquences obtenues dans mon rapport.
    Lors de mes recherches j'ai trouvé le module bio::taxon mais il faut que j'utilise un rapport genbank.Il faudrait donc que pour chaque séquences je récupère le rapport genbank et que par la suite je récupère le taxon.
    Cette méthode me semble très longue mais je ne trouve pas d'alternative. Le mieux serait d'avoir directement accès au taxon mais je ne vois pas comment.
    j’espère que j'ai été clair.peut être que la réponse est évidente mais la je patauge!!

  5. #5
    Membre à l'essai
    Profil pro
    Inscrit en
    Mars 2011
    Messages
    7
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Mars 2011
    Messages : 7
    Par défaut
    je pense que tu pourrais gagner beaucoup de temps et d'efficacité en utilisant un système expert (genre réseau neuronal) pour la détermination de l'espèce.

    en gros il faut un programme qui permet d'analyser les probabilités de successsions de bases
    dans un premier temps on entraine le programme en lui donnant une série importante (et variée) de séquences appartenant à chaque espèce suceptible de t'intéresser (tes "matchs" donc) ET l'espèce correspondant à chaque séquence

    le programme calcule donc les probabilités de trouver un "a" après un "t" (par exemple, et ce pour toutes les combinaisons a-t a-c a-g a-a etc) pour chaque espèce

    voila ton programme est "entrainé", certains disent meme qu'il a "appris" ^^

    reste à soumettre ta séquence inconnue (query) pour que le programme compare les probabilités de chaque succession de base afin de sortir une espèce la plus proche


    il est égalemetn possible d'ajuster le programme en lui soumettant des séquences de test, inconnues pour lui, il prédit une espéce, si c'est bon c'est bien, s'il s'est planté il s'ajuste

    si ça t'intéresse, c'est exactement le principe des programmes de reconnaissance de langage utilisés en linguistique ou n'importe ou sur le net (google doit en avoir un il me semble)


    de manière générale toute la bioinfo s'inspire de la linguistique, ce ne sont que des lettres et un alignement peut aussi bien prédire l'évolution d'un mot (genre nom de famille) ou l'évolution d'un gène

Discussions similaires

  1. Besoin de pistes avant de débuter un projet
    Par Fused dans le forum Logging
    Réponses: 2
    Dernier message: 23/07/2009, 17h54
  2. Demande d'orientation pour débuter un projet
    Par eldran64 dans le forum OpenCV
    Réponses: 3
    Dernier message: 08/05/2009, 21h23
  3. Comment débuter mon projet ?
    Par Longbow dans le forum Débuter
    Réponses: 2
    Dernier message: 18/02/2009, 10h52
  4. Bien débuter mon projet de BD
    Par Yepazix dans le forum Access
    Réponses: 3
    Dernier message: 14/12/2008, 19h31
  5. Comment bien débuter un projet?
    Par Sylvester dans le forum Langage
    Réponses: 3
    Dernier message: 02/03/2006, 20h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo