|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Candidat au titre de Membre du Club
![]() Étudiant Inscription : mai 2010 Messages : 13 ![]() |
Bonjour,
j'ai télécharger une séquence upstream(en amont du gène) à partir d'une base de donnée sous le format Fasta. je veux déterminer la position en -XXX pb. mais parfois il y a des séquences qui sont marquées FORWARD d'autres REVERSE. y a t'il différence entre les deux? exemple1: >XXXXXX FORWARD ATCGATCGATCGATCG. position: -???? pb >YYYYYY REVERSE ATCGATCGATCGATCG. position: -???? pb quelqu'un peut m'aider SVP pour déterminer la position des séquences colorés en rouge. merci d'avance cordialement |
|
|
00
|
|
|
#2 | ||||
|
Membre Expert
![]() ![]() Jasmine Inscription : octobre 2006 Messages : 2 814 ![]() |
Citation:
Citation:
Que veux-tu rechercher, le motif ATCG. Ce motif est-il toujours précédé de xxx et suivi de xxxx ? Ce motif est trop petit que pour être cherché tel quel, tu peux le trouver facilement par hasard. Tu dois déterminer d'autres critères de recherche, comme par exemple les nucléotides devant précéder et suivre ce motif. Voila à quoi doit ressembler le script : tu peux modifier l'expression régulière m/(ATCG)/ par m/ATCG(ATCG)ATCG/ afin de rechercher un motif plus grand. Le module Bio::SeqIO te permet de récupérer proprement les données de ton fichier. Code :
__________________
-- Jasmine -- Merci de poser les questions dans le forum, je ne répondrai pas aux MP. |
||||
|
|
10
|
|
|
#3 |
|
Candidat au titre de Membre du Club
![]() Étudiant Inscription : mai 2010 Messages : 13 ![]() |
Bonjour,
Merci Jasmine80 pour la réponse j'ai télécharger un fichier contenant les séquences upstreame des gènes à partir d'une base de données. ces sequences sont en format FASTA. exemple explicatif de sequence: >XX1G56520 | chr1:2695538-2696537 FORWARD LENGTH=500ATCGATCGATCGATCGGAGAGAGATCGATCGATCGATCGATCG>YY1G56520 | chr1:2695538-2696539 FORWARD LENGTH=500ATCGATCGATCGATCGGAGAGAGATCGATCGATCGATCGATCG.... moi je veux écrire un code en bio perl qui: lit le fichier contenant les séquences ( on peux ouvrir avec bloc note, Word ...) recherche un motif bien déterminer (eg. GAGAGAGATCGA) donne à quelle gène correspond cette séquence ( par exemple pour le motif coloré en rouge en note le code de gène "XX1G56520". ID qui se trouve juste après la signe ">" précédente au motif ) détermine la position de ce motif par rapport au codon start, autrement compte le nombre de lettre en commencent par le premier lettre de motif jusqu'à le dernier lettre avant la signe ">" suivante. donner les résultats sous la forme d'un tableau contenant le code de chaque gène et la position de motif correspondant( nombre de lettre trouver avec une signe mois "-") si vous voulez plus d'explication je suis toujours à votre disposition. aider moi SVP c'est urgent. cordialement |
|
|
00
|
|
|
#4 | ||||
|
Membre Expert
![]() ![]() Jasmine Inscription : octobre 2006 Messages : 2 814 ![]() |
Bonjour Joyeux,
Tu dois ouvrir le fichier de cette façon : Code :
open my $in_file_fh, '<', $file or die; .. afin de les analyser via des expressions régulières : Code :
Ce qui donne (script à adapter à ton cas) Code :
Voici la FAQ sur les expressions régulières et les fichiers Si tu as d'autres questions, n'hésite pas.
__________________
-- Jasmine -- Merci de poser les questions dans le forum, je ne répondrai pas aux MP. |
||||
|
|
10
|
|
|
#5 |
|
Candidat au titre de Membre du Club
![]() Étudiant Inscription : mai 2010 Messages : 13 ![]() |
Bonjour,
premièrement, un grand merci à Jasmine80 pour tout l'aide qu'il m'a fourni. mais le problème que pour la position j'ai pas pu la déterminer, parce que moi je veux la position par rapport au codon start dans une séquence upstream, donc j'ai besoin de compter le nombre les lettres en commençant par la signe ">" qui suit le motif. j'ai essayé avec mais elle détermine la position par rapport au début de la ligne. de plus, pour je sais pas qu'est ce qu'il faut écrire à fin que le tableau affiche le id de gène et la position. c'est pas forcement que les résultats s'affichent sous la forme d'un tableau, l’essentiel on obtient code du gène suivie de la position correspondante. exemple explicatif de séquence: >XX1G56520 | chr1:2695538-2696537 FORWARD LENGTH=500ATCGATCGATCGATCGGAGAGAGATCGATCGATC>YY1G56520 | chr1:2695538-2696539 FORWARD LENGTH=500ATCGATCGATCGATCGGAGAGAGATCGATCGATCGATCGATCG.... pour le motif en rouge id de gene: XX1G56520 la position: -18 to -7 je suis encore débutant Merci d'avance |
|
|
00
|
|
|
#6 | ||||
|
Membre Expert
![]() ![]() Jasmine Inscription : octobre 2006 Messages : 2 814 ![]() |
Citation:
Si ta ligne vaut = '>XX1G56520 | chr1:2695538-2696537 FORWARD LENGTH=500ATCGATCGATCGATCGGAGAGAGATCGA', que tu cherches le motif GAGAGAGATCGA et que tu fais : Code :
Citation:
__________________
-- Jasmine -- Merci de poser les questions dans le forum, je ne répondrai pas aux MP. |
||||
|
|
10
|
|
|
#7 | ||
|
Candidat au titre de Membre du Club
![]() Étudiant Inscription : mai 2010 Messages : 13 ![]() |
Bonjour,
Merci beaucoup Jasmine ![]() mais, le code présente encore des erreurs SVP, aidez moi à les corriger. je veux que programme tourne et m'affiche les résultats, je les besoins beaucoup. Code :
|
||
|
|
00
|
|
|
#8 | ||
|
Membre Expert
![]() Inscription : avril 2009 Messages : 2 218 ![]() |
Pour la boucle principale, il est peut-être possible d'envisager cela ainsi :
Code :
__________________
Plus j'apprends, et plus je mesure mon ignorance (philou67430) Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book) Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé Using strict and warnings is good for you. |
||
|
|
10
|
|
|
#9 |
|
Candidat au titre de Membre du Club
![]() Étudiant Inscription : mai 2010 Messages : 13 ![]() |
Bonjour,
Merci Philou67430, Merci Jasmine80. mais mon problème n'est pas encore résolu .il y a toujours des erreurs qui s'affichent. Cordialement |
|
|
00
|
|
|
#10 |
|
Membre Expert
![]() Inscription : avril 2009 Messages : 2 218 ![]() |
Merci de poster ici les réponses que vous m'avez faites en privé.
De même, postez le script que vous avez utilisé qui provoquent les erreurs que vous m'avez envoyées, car je doute que la partie de script que j'ai postée plus haut ne soit à l'origine de ces erreurs.
__________________
Plus j'apprends, et plus je mesure mon ignorance (philou67430) Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book) Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé Using strict and warnings is good for you. |
|
|
10
|
|
|
#11 | |||
|
Candidat au titre de Membre du Club
![]() Étudiant Inscription : mai 2010 Messages : 13 ![]() |
Bonjour,
Merci bien Philou67430 pour votre aide. voici le code Code :
Code :
print "$id: ", $-[0] - $-[1], " -> ", $-[0] + length($pattern) - $-[1], "\n"; Citation:
Merci d'avance Bien cordialement |
|||
|
|
00
|
|
|
#12 | ||
|
Membre Expert
![]() Inscription : avril 2009 Messages : 2 218 ![]() |
Le manque de résultat vient du fait que les séquences ne sont pas enregistrées sur une seule ligne, mais sur plusieurs lignes.
Pour faire les recherches, il faut donc d'abord "concaténer" toutes les lignes d'une séquence, et ensuite seulement faire la recherche. De même, l'expression régulière pour extraire l'ID était trop restrictive. Enfin, avec le fichier que vous m'avez fourni en MP, il n'y a aucune ligne de séquence pour laquelle on trouve un > au milieu des nucléotides... du coup, la recherche "du start" échoue toujours... Je ne peux aller plus loin. Le script en l'état : Code :
__________________
Plus j'apprends, et plus je mesure mon ignorance (philou67430) Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book) Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé Using strict and warnings is good for you. |
||
|
|
10
|
|
|
#13 |
|
Candidat au titre de Membre du Club
![]() Étudiant Inscription : mai 2010 Messages : 13 ![]() |
Bonjour,
ok un grand Merci Philou67430 pour tout l'effort et l'aide que vous m'avez fournis. déjà, le code que vous m'avez donné est un pas très important pour moi. mais si quel qu’un 'autres à une idée, je serai très reconnaissant. Merci d'avance cordialement |
|
|
00
|
|
|
#14 |
|
Candidat au titre de Membre du Club
![]() Étudiant Inscription : mai 2010 Messages : 13 ![]() |
Bonjour,
Merci beaucoup Jasmine , Merci beaucoup Philou67430 .C'est résolu |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com