Précédent   Forum des professionnels en informatique > Autres langages > Perl > Bioinformatique
Bioinformatique Toutes vos questions sur les scripts Perl associés à la bioinformatique, modules bioperl, projets bioinformatiques, etc ... Avant de poster, veuillez consulter les cours Perl et les critiques de livres.
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 10/06/2011, 19h47   #1
Invité de passage
 
Femme marie lefevre
Étudiant
Inscription : juin 2011
Messages : 4
Détails du profil
Informations personnelles :
Nom : Femme marie lefevre
Localisation : France, Vienne (Poitou Charente)

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : juin 2011
Messages : 4
Points : 0
Points : 0
Par défaut Débuter un projet de détermination de d'espèces

bonjour tous le monde

Je suis étudiante en génie physiologique et informatique et je suis actuellement en stage au Etats Unis pour valider ma L3
Mon sujet de stage a changé ,je dois maintenant créer un programme étant débutante en programmation je suis un peu perdu et je ne sais pas trop par quel bout commencer.



Je vous explique un peu mon sujet ,je dois réaliser un programme qui à partir de séquence ADN (barcoding DNa)permet après un blast de savoir à quelles espèces ces séquences appartiennent et après regrouper le tout en statistique.
Je pensais utiliser bioperl pour le blast et après utiliser R pour traduire mes données en statistique.
Si quelqu'un peut m'eclairer un petit peu une fois que je serais lancer normalement ça devrait aller!!
marie.lefebvre1608 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 24/06/2011, 15h44   #2
Responsable Perl et Outils

 
Avatar de djibril
 
Homme
Inscription : avril 2004
Messages : 9 350
Détails du profil
Informations personnelles :
Sexe : Homme
Âge : 32
Localisation : France

Informations forums :
Inscription : avril 2004
Messages : 9 350
Points : 13 722
Points : 13 722
Tu as un maitre de stage avec qui tu peux discuter pour définir ton cahier des charges. Nous ne pouvons pas deviner et faire ce travail à ta place .
__________________
Pensez toujours aux cours, FAQ Perl et la fonction recherchez!!!!!!!!
Lisez les règles du forum Perl.

Aucun problème par MP, merci de poster vos questions dans les sous forums dédiés et rendez vos codes sources lisibles
djibril est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 27/06/2011, 10h31   #3
Membre Expert
 
Avatar de Jasmine80
 
Jasmine
Inscription : octobre 2006
Messages : 2 814
Détails du profil
Informations personnelles :
Nom : Jasmine
Âge : 32
Localisation : Belgique

Informations forums :
Inscription : octobre 2006
Messages : 2 814
Points : 2 079
Points : 2 079
Citation:
Envoyé par marie.lefebvre1608 Voir le message
Je pensais utiliser bioperl pour le blast et après utiliser R pour traduire mes données en statistique.
Si quelqu'un peut m'eclairer un petit peu une fois que je serais lancer normalement ça devrait aller!!

Bonjour Marie,

Ton projet a-t-il bien avancé?

Comme l'a souligné Djibril nous devrions en savoir plus afin de t'aider, voici néanmoins quelques pistes :

Sous-quelle forme sont stockées tes séquences de départ? Une base de données, un fichier texte?

Pour les statistiques si tu veux passer par perl, tu peux utiliser le module Statistics::R - Controls the R (R-project) interpreter through Perl.

Pour les blast, tu peux utiliser le module Bio::Tools::Run::RemoteBlast - Object for remote execution of the NCBI Blast via HTTP. Ecris ton programme en te basant sur le synopsis. N'hésite pas à repasser sur le forum si tu es bloquée et que tu as une question précise. Pense aussi à la FAQ et aux tutoriels. Bon travail.
__________________
-- Jasmine --

Merci de poser les questions dans le forum, je ne répondrai pas aux MP.
Jasmine80 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 05/07/2011, 21h27   #4
Invité de passage
 
Femme marie lefevre
Étudiant
Inscription : juin 2011
Messages : 4
Détails du profil
Informations personnelles :
Nom : Femme marie lefevre
Localisation : France, Vienne (Poitou Charente)

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : juin 2011
Messages : 4
Points : 0
Points : 0
bonjour
merci d'avoir pris le temps de me répondre.
En passant quelques heures pour ne pas dire quelques jours j'ai reussi à bien demarrer mais etant complement novice en bioperl tout deviens vite compliqué
J'ai reussi à utiliser remoteblast et à obtenir un rapport blast mais mon principal problème est que je n'arrive pas à extraire les informations taxonomiques de toutes les séquences obtenues dans mon rapport.
Lors de mes recherches j'ai trouvé le module bio::taxon mais il faut que j'utilise un rapport genbank.Il faudrait donc que pour chaque séquences je récupère le rapport genbank et que par la suite je récupère le taxon.
Cette méthode me semble très longue mais je ne trouve pas d'alternative. Le mieux serait d'avoir directement accès au taxon mais je ne vois pas comment.
j’espère que j'ai été clair.peut être que la réponse est évidente mais la je patauge!!
marie.lefebvre1608 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/08/2011, 11h27   #5
Invité régulier
 
Inscription : mars 2011
Messages : 7
Détails du profil
Informations forums :
Inscription : mars 2011
Messages : 7
Points : 9
Points : 9
je pense que tu pourrais gagner beaucoup de temps et d'efficacité en utilisant un système expert (genre réseau neuronal) pour la détermination de l'espèce.

en gros il faut un programme qui permet d'analyser les probabilités de successsions de bases
dans un premier temps on entraine le programme en lui donnant une série importante (et variée) de séquences appartenant à chaque espèce suceptible de t'intéresser (tes "matchs" donc) ET l'espèce correspondant à chaque séquence

le programme calcule donc les probabilités de trouver un "a" après un "t" (par exemple, et ce pour toutes les combinaisons a-t a-c a-g a-a etc) pour chaque espèce

voila ton programme est "entrainé", certains disent meme qu'il a "appris" ^^

reste à soumettre ta séquence inconnue (query) pour que le programme compare les probabilités de chaque succession de base afin de sortir une espèce la plus proche


il est égalemetn possible d'ajuster le programme en lui soumettant des séquences de test, inconnues pour lui, il prédit une espéce, si c'est bon c'est bien, s'il s'est planté il s'ajuste

si ça t'intéresse, c'est exactement le principe des programmes de reconnaissance de langage utilisés en linguistique ou n'importe ou sur le net (google doit en avoir un il me semble)


de manière générale toute la bioinfo s'inspire de la linguistique, ce ne sont que des lettres et un alignement peut aussi bien prédire l'évolution d'un mot (genre nom de famille) ou l'évolution d'un gène
-SKUD- est déconnecté   Envoyer un message privé Réponse avec citation 10
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 05h02.


 
 
 
 
Partenaires

Hébergement Web