Mail reçu de Sara

bonjour jasmine,
j'ai vu que ta tres bien repondu à notre amie sur ces bactereie en biopel.
moi aussi je debut en bioinformatique et je suis entrain de me former en biopel et je dois te dire que c pas facile.
mon problem est que je dois recupere des sequence d'une part du gene et d'autre part de son ARNm chez la souris.
je te donne un exemple :
mon fichier est celui la:
http://www.mirz.unibas.ch/ElMMo2/Bul...ullList.tab.gz

il ce compose des information suivant:
NM_001001565|TR(1..3100)CDS(832..2670) 7 14 GCACCTGT .....
NM_001001565|TR(1..3100)CDS(832..2670) 87 94 TAGGGCAG .....
NM_001001565|TR(1..3100)CDS(832..2670) 179 186 TGTCCAGT

je dois donc chercher la sequence de NM_001001565 entre autre.
j'ai trouver la sequence sur ce line :
http://www.ncbi.nlm.nih.gov/entrez/v...re&id=48525358

je ne sais pas sur quel base appller; et quelle requet faire;

toute information est la bien venu...

merci
sarah
1) lis ton fichier ligne par ligne et récupère les accession number
2) interroge GenBank

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
#!/usr/local/bin/perl
 
use strict;
use Bio::DB::GenBank;
 
# Lecture du fichier et récupération des acc
#----------------------------------------------
my $file = "P:/Perl/scripts/Files/acc.txt";
open(FICH, $file) or die "impossible d'ouvrir le fichier";
my $line;
my @request;
while ($line = <FICH>){
    if($line =~ /^(\w+)|TR/){
        push (@request, $1);
    }
}
close(FICH);
 
 
my $gb = new Bio::DB::GenBank;
 
foreach my $acc (@request){
    # Recherche dans Genbank
    #--------------------------
    my $info = $gb->get_Seq_by_acc($acc);
    my $seq = $info->seq();
    print $seq;
}
Tu auras le message, c'est normal
MSG: [NM_001001565] is not a normal sequence database but a RefSeq entry. Redirecting the request.