|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Invité de passage
![]() marie lefevreÉtudiant Inscription : juin 2011 Messages : 4 ![]() |
bonjour tous le monde
Je suis étudiante en génie physiologique et informatique et je suis actuellement en stage au Etats Unis pour valider ma L3 Mon sujet de stage a changé ,je dois maintenant créer un programme étant débutante en programmation je suis un peu perdu et je ne sais pas trop par quel bout commencer. Je vous explique un peu mon sujet ,je dois réaliser un programme qui à partir de séquence ADN (barcoding DNa)permet après un blast de savoir à quelles espèces ces séquences appartiennent et après regrouper le tout en statistique. Je pensais utiliser bioperl pour le blast et après utiliser R pour traduire mes données en statistique. Si quelqu'un peut m'eclairer un petit peu une fois que je serais lancer normalement ça devrait aller!! |
|
|
00
|
|
|
#2 |
![]() ![]() ![]() Inscription : avril 2004 Messages : 9 350 ![]() |
Tu as un maitre de stage avec qui tu peux discuter pour définir ton cahier des charges. Nous ne pouvons pas deviner et faire ce travail à ta place
__________________
Pensez toujours aux cours, FAQ Perl et la fonction recherchez!!!!!!!! Lisez les règles du forum Perl. Aucun problème par MP, merci de poster vos questions dans les sous forums dédiés et rendez vos codes sources lisibles |
|
|
00
|
|
|
#3 | |
|
Membre Expert
![]() ![]() Jasmine Inscription : octobre 2006 Messages : 2 814 ![]() |
Citation:
Bonjour Marie, Ton projet a-t-il bien avancé? Comme l'a souligné Djibril nous devrions en savoir plus afin de t'aider, voici néanmoins quelques pistes : Sous-quelle forme sont stockées tes séquences de départ? Une base de données, un fichier texte? Pour les statistiques si tu veux passer par perl, tu peux utiliser le module Statistics::R - Controls the R (R-project) interpreter through Perl. Pour les blast, tu peux utiliser le module Bio::Tools::Run::RemoteBlast - Object for remote execution of the NCBI Blast via HTTP. Ecris ton programme en te basant sur le synopsis. N'hésite pas à repasser sur le forum si tu es bloquée et que tu as une question précise. Pense aussi à la FAQ et aux tutoriels. Bon travail.
__________________
-- Jasmine -- Merci de poser les questions dans le forum, je ne répondrai pas aux MP. |
|
|
|
00
|
|
|
#4 |
|
Invité de passage
![]() marie lefevreÉtudiant Inscription : juin 2011 Messages : 4 ![]() |
bonjour
merci d'avoir pris le temps de me répondre. En passant quelques heures pour ne pas dire quelques jours j'ai reussi à bien demarrer mais etant complement novice en bioperl tout deviens vite compliqué J'ai reussi à utiliser remoteblast et à obtenir un rapport blast mais mon principal problème est que je n'arrive pas à extraire les informations taxonomiques de toutes les séquences obtenues dans mon rapport. Lors de mes recherches j'ai trouvé le module bio::taxon mais il faut que j'utilise un rapport genbank.Il faudrait donc que pour chaque séquences je récupère le rapport genbank et que par la suite je récupère le taxon. Cette méthode me semble très longue mais je ne trouve pas d'alternative. Le mieux serait d'avoir directement accès au taxon mais je ne vois pas comment. j’espère que j'ai été clair.peut être que la réponse est évidente mais la je patauge!! |
|
|
00
|
|
|
#5 |
|
Invité régulier
![]() Inscription : mars 2011 Messages : 7 ![]() |
je pense que tu pourrais gagner beaucoup de temps et d'efficacité en utilisant un système expert (genre réseau neuronal) pour la détermination de l'espèce.
en gros il faut un programme qui permet d'analyser les probabilités de successsions de bases dans un premier temps on entraine le programme en lui donnant une série importante (et variée) de séquences appartenant à chaque espèce suceptible de t'intéresser (tes "matchs" donc) ET l'espèce correspondant à chaque séquence le programme calcule donc les probabilités de trouver un "a" après un "t" (par exemple, et ce pour toutes les combinaisons a-t a-c a-g a-a etc) pour chaque espèce voila ton programme est "entrainé", certains disent meme qu'il a "appris" ^^ reste à soumettre ta séquence inconnue (query) pour que le programme compare les probabilités de chaque succession de base afin de sortir une espèce la plus proche il est égalemetn possible d'ajuster le programme en lui soumettant des séquences de test, inconnues pour lui, il prédit une espéce, si c'est bon c'est bien, s'il s'est planté il s'ajuste si ça t'intéresse, c'est exactement le principe des programmes de reconnaissance de langage utilisés en linguistique ou n'importe ou sur le net (google doit en avoir un il me semble) de manière générale toute la bioinfo s'inspire de la linguistique, ce ne sont que des lettres et un alignement peut aussi bien prédire l'évolution d'un mot (genre nom de famille) ou l'évolution d'un gène |
|
|
10
|
Copyright © 2000-2012 - www.developpez.com