Mail reçu de Sara
1) lis ton fichier ligne par ligne et récupère les accession numberbonjour jasmine,
j'ai vu que ta tres bien repondu à notre amie sur ces bactereie en biopel.
moi aussi je debut en bioinformatique et je suis entrain de me former en biopel et je dois te dire que c pas facile.
mon problem est que je dois recupere des sequence d'une part du gene et d'autre part de son ARNm chez la souris.
je te donne un exemple :
mon fichier est celui la:
http://www.mirz.unibas.ch/ElMMo2/Bul...ullList.tab.gz
il ce compose des information suivant:
NM_001001565|TR(1..3100)CDS(832..2670) 7 14 GCACCTGT .....
NM_001001565|TR(1..3100)CDS(832..2670) 87 94 TAGGGCAG .....
NM_001001565|TR(1..3100)CDS(832..2670) 179 186 TGTCCAGT
je dois donc chercher la sequence de NM_001001565 entre autre.
j'ai trouver la sequence sur ce line :
http://www.ncbi.nlm.nih.gov/entrez/v...re&id=48525358
je ne sais pas sur quel base appller; et quelle requet faire;
toute information est la bien venu...
merci
sarah
2) interroge GenBank
Tu auras le message, c'est normal
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28 #!/usr/local/bin/perl use strict; use Bio::DB::GenBank; # Lecture du fichier et récupération des acc #---------------------------------------------- my $file = "P:/Perl/scripts/Files/acc.txt"; open(FICH, $file) or die "impossible d'ouvrir le fichier"; my $line; my @request; while ($line = <FICH>){ if($line =~ /^(\w+)|TR/){ push (@request, $1); } } close(FICH); my $gb = new Bio::DB::GenBank; foreach my $acc (@request){ # Recherche dans Genbank #-------------------------- my $info = $gb->get_Seq_by_acc($acc); my $seq = $info->seq(); print $seq; }
MSG: [NM_001001565] is not a normal sequence database but a RefSeq entry. Redirecting the request.
Partager