IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

requete Genbank sur des accessions


Sujet :

Bioinformatique Perl

  1. #1
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut requete Genbank sur des accessions
    Mail reçu de Sara

    bonjour jasmine,
    j'ai vu que ta tres bien repondu à notre amie sur ces bactereie en biopel.
    moi aussi je debut en bioinformatique et je suis entrain de me former en biopel et je dois te dire que c pas facile.
    mon problem est que je dois recupere des sequence d'une part du gene et d'autre part de son ARNm chez la souris.
    je te donne un exemple :
    mon fichier est celui la:
    http://www.mirz.unibas.ch/ElMMo2/Bul...ullList.tab.gz

    il ce compose des information suivant:
    NM_001001565|TR(1..3100)CDS(832..2670) 7 14 GCACCTGT .....
    NM_001001565|TR(1..3100)CDS(832..2670) 87 94 TAGGGCAG .....
    NM_001001565|TR(1..3100)CDS(832..2670) 179 186 TGTCCAGT

    je dois donc chercher la sequence de NM_001001565 entre autre.
    j'ai trouver la sequence sur ce line :
    http://www.ncbi.nlm.nih.gov/entrez/v...re&id=48525358

    je ne sais pas sur quel base appller; et quelle requet faire;

    toute information est la bien venu...

    merci
    sarah
    1) lis ton fichier ligne par ligne et récupère les accession number
    2) interroge GenBank

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    #!/usr/local/bin/perl
     
    use strict;
    use Bio::DB::GenBank;
     
    # Lecture du fichier et récupération des acc
    #----------------------------------------------
    my $file = "P:/Perl/scripts/Files/acc.txt";
    open(FICH, $file) or die "impossible d'ouvrir le fichier";
    my $line;
    my @request;
    while ($line = <FICH>){
        if($line =~ /^(\w+)|TR/){
            push (@request, $1);
        }
    }
    close(FICH);
     
     
    my $gb = new Bio::DB::GenBank;
     
    foreach my $acc (@request){
        # Recherche dans Genbank
        #--------------------------
        my $info = $gb->get_Seq_by_acc($acc);
        my $seq = $info->seq();
        print $seq;
    }
    Tu auras le message, c'est normal
    MSG: [NM_001001565] is not a normal sequence database but a RefSeq entry. Redirecting the request.
    -- Jasmine --

  2. #2
    Membre à l'essai
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 15
    Points : 15
    Points
    15
    Par défaut
    j'ai pas encor essyer le tien mais je te montre le mien.
    par la suit je veux faire un blat ou un sim4 entre les sequence de ma propre base de donnée et les sequence que j'aurai trouvé avec la base de donnée bioperl
    c'est pour cela que je laisse la requet dans le while

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    #!/usr/local/bin/perl -w
    use strict;
     
     
    use Bio::SeqIO ;
    use Bio::DB::GenBank;
    use Bio::DB::RefSeq;
     
     
    open (LIRE, "acc.txt") || die "Pbl ouverture fichier LIRE";
     
    my ($ligne,$sequence,$db);
    while ($ligne = <LIRE>)
    {	
    	my ($acc,$cds,$start_mir,$end_mir,$seq_mir,$mir);
    	$acc="";$cds="";$start_mir="";$end_mir="";$seq_mir="";$mir="";
    	chomp $ligne;
    	$ligne=~ s/ +/ /g;
    	for ($ligne=~ m/.+/)
    	{	
    		for ($ligne=~ m/^(.+)\|TR\(.+\)CDS\(\d+\.\.(\d+)\) (\d+) (\d+) ([ATGC]+) .+ (.+) [0-9]+ .+ [0-9]+/)
    		{	
    			$acc=$1;$cds=$2;$start_mir=$3 + $cds;$end_mir=$4 + $cds;$seq_mir=$5;$mir=$6;
    		}
    		open (ECRIR, ">>full.txt");
    		$db = Bio::DB::RefSeq -> new();
    		$sequence = $db -> get_Seq_by_id($acc);
    		print ECRIR "> " ;
    		print ECRIR $sequence -> desc(), "\n" ;
    		print ECRIR $sequence -> seq(), "\n" ;
    		close ECRIR; close LIRE;
    	}
     
    }
    et voila ce qu'il me revoi
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    -------------------- WARNING ---------------------
    MSG: id () does not exist
    ---------------------------------------------------
    Can't call method "desc" on an undefined value at bioperl.pl line 31.


    une remarque: je trouve que tu est rapide, chapo

  3. #3
    Membre à l'essai
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 15
    Points : 15
    Points
    15
    Par défaut rappel
    avant de faire mon code j'ai essyer celiu la et ça marche
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
     
    use Bio::SeqIO ;
    use Bio::DB::GenBank;
    use Bio::DB::RefSeq;
     
    $db = Bio::DB::RefSeq -> new();
     
    $sequence = $db -> get_Seq_by_id("XM_981806");
     
    print "> " ;
    print $sequence -> display_id(), "\n" ; #refseq accession
    print $sequence -> accession_number(), "\n" ;
    print $sequence -> desc(), "\n" ;
    print $sequence -> seq(), "\n" ;

  4. #4
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    C'est normal que tu ne trouves rien.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $sequence = $db -> get_Seq_by_id($acc);
    Tu lui demandes une recherche d'id et tu lui passes un accession !!!

    Fais comme je l'ai expliqué plus haut :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $sequence = $db -> get_Seq_by_acc($acc);
    -- Jasmine --

  5. #5
    Membre à l'essai
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 15
    Points : 15
    Points
    15
    Par défaut cool
    c super ça merche
    merci
    et en plus j trouver mon erreur sur mon script
    j'ai mal matcher ma ligne dans
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    for ($ligne=~ m/^(.+)\|TR\(.+\)CDS\(\d+\.\.(\d+)\) (\d+) (\d+) ([ATGC]+....
    je l'es remplacer par un split


    merci merci et à bientôt

  6. #6
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Si tu n'as plus de questions, indique que ce sujet est résolu en cochant la case ci-dessous.
    -- Jasmine --

  7. #7
    Membre à l'essai
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 15
    Points : 15
    Points
    15
    Par défaut
    Oui, normalment c bon, cette question est résolue
    le programme je l'ai lancer hier, et jusqu'a aujourd'hui il tourne encore.
    es-que c normal que ça prend tout ce temps?

    pour finir je ne voie pas le case à coche, désolé

  8. #8
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Citation Envoyé par sarah.c.g Voir le message
    Oui, normalment c bon, cette question est résolue
    le programme je l'ai lancer hier, et jusqu'a aujourd'hui il tourne encore.
    es-que c normal que ça prend tout ce temps?

    pour finir je ne voie pas le case à coche, désolé
    C'est normal si tu as 2000 séquences de 2000000 nucléotides à récupérer mais pas si tu n'en as que 2 de 500 nucléotides

    La case à cocher est juste sous ce post

    Je vais tester ton script sur mon pc et je te dis quoi
    -- Jasmine --

  9. #9
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    C'est incorrect
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    $db = Bio::DB::RefSeq -> new();
     
    $sequence = $db -> get_Seq_by_id("XM_981806");


    Voila comment procéder
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    use strict;
    use Bio::DB::GenBank;
     
    my $gb = new Bio::DB::GenBank;
    my $sequence = $gb -> get_Seq_by_acc('AF267901');
     
     
    print "> " ;
    print $sequence -> primary_id(), "\n" ; # Gi
    print $sequence -> accession_number(), "\n" ;
    print $sequence -> desc(), "\n" ;
    print $sequence -> seq(), "\n" ;
    -- Jasmine --

  10. #10
    Membre à l'essai
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 15
    Points : 15
    Points
    15
    Par défaut
    mon code est le suivant :
    je sais je fais tjr trop compliquer.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
     
    #!/usr/local/bin/perl -w
    use strict;
    use Bio::SeqIO ;
    use Bio::DB::GenBank;
    use Bio::DB::RefSeq;
     
    # Lecture du fichier et récupération des acc
    # # ----------------------------------------------
     
    open (LIRE, "mm_targets_FullList.txt") || die "Pbl ouverture fichier LIRE";
    my @liste;
    my $ligne;
    while ($ligne = <LIRE>)
    {	#je dois recuperer tous les champ pour plutard
            my ($acc,$cds,$start_mir,$end_mir,$seq_mir,$mir);
    	$acc="";$cds="";$start_mir="";$end_mir="";$seq_mir="";$mir="";
    	chomp $ligne;
    	$ligne=~ s/ +/ /g;
    	$ligne=~ s/\|TR.+CDS/ CDS/g;
    	for ($ligne=~ m/.+/)
    	{	my $lig;
    		my @lig= split(' ',$ligne);
    		$acc=$lig[0];$cds=$lig[1];$start_mir=$lig[2];$end_mir=$lig[3];$seq_mir=$lig[4];$mir=$lig[6];
    		push(@liste,$acc);
    	}
    }
    close LIRE;
     
    my $db = new Bio::DB::RefSeq;
    foreach my $id (@liste)
    {	
    	my $sequence = "";
            # comme les acc se répètent dans le fichier de départ
            #je redirection pour chaque seq de chaque acc dans un fichier propre
    	open (ECRIR, ">/home/sarah/miR_epissage/projet_db_mir/mirz/gene/$id.txt");
    	$sequence = $db -> get_Seq_by_id($id);
    	if ($sequence ne "")
    	{	print ECRIR "> " ;
    		print ECRIR $sequence -> display_id(), ", " ; #refseq accession
    		print ECRIR $sequence -> desc(), "\n" ;
    		print ECRIR $sequence -> seq(), "\n" ;
    	}
     
            else 
           #je recuper les sequence quil a pas trouver et jairai les chercher manuellement
    	{	print "$id\n" ;}
    }
    close ECRIR;
    # apres avoir tous recuperer je fait un cat de tout les fichier obtenu 
    #en sort d'avoir toute les sequence dans un seul fichier.fa 
    #et chaque sequence est separer par > nom acc.

  11. #11
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    que contient $id? un acc? un Gi?
    Tu peux faire directement une seule requête et récupérer un groupe d'identifiants
    -- Jasmine --

  12. #12
    Membre à l'essai
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 15
    Points : 15
    Points
    15
    Par défaut
    justement c'est pas le code acc ('AF267901') que je dois recuperer
    mais c'est plutot celui du fichier
    http://www.mirz.unibas.ch/ElMMo2/Bul...ullList.tab.gz
    et le acc ('AF267901') n'est pas present dans le fichier
    Citation Envoyé par Jasmine80 Voir le message
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    use strict;
    use Bio::DB::GenBank;
     
    my $gb = new Bio::DB::GenBank;
    my $sequence = $gb -> get_Seq_by_acc('AF267901');
     
     
    print "> " ;
    print $sequence -> primary_id(), "\n" ; # Gi
    print $sequence -> accession_number(), "\n" ;
    print $sequence -> desc(), "\n" ;
    print $sequence -> seq(), "\n" ;
    d'où le DB::RefSeq
    les sequence que je dois récupere sont (un exemple est XM_981806)
    http://www.ncbi.nlm.nih.gov/entrez/v...re&id=94409763
    regarde tout a fai en bas ya la sequnce
    et bien c'est celle la que je doi récupere

  13. #13
    Membre à l'essai
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 15
    Points : 15
    Points
    15
    Par défaut
    Citation Envoyé par Jasmine80 Voir le message
    que contient $id? un acc? un Gi?
    Tu peux faire directement une seule requête et récupérer un groupe d'identifiants
    le $id est le acc qu'on a recuperer dans le push
    mais avec une seul requete il va me repeter la sequence plusieur foi vu que dans le fichier pour chaque ligne le acc ce repete plusieur foi
    exempl
    [sarah@poseidon fichier_db]
    tail mm_targets_FullList.txt
    XM_981806|TR(1..1171)CDS(1..669) 117 124 ATTTGTTT 6s mmu-miR-495 10000000 0.0480091172430172
    XM_981806|TR(1..1171)CDS(1..669) 168 175 ACACTTTG 6s mmu-miR-106a 10000000 0.17554150846298
    XM_981806|TR(1..1171)CDS(1..669) 168 175 ACACTTTG 6s mmu-miR-93 10000000 0.17554150846298
    XM_981806|TR(1..1171)CDS(1..669) 168 175 ACACTTTG 6s mmu-miR-17 10000000 0.17554150846298
    XM_981806|TR(1..1171)CDS(1..669) 168 175 ACACTTTG 6s mmu-miR-20b 10000000 0.17554150846298
    XM_981806|TR(1..1171)CDS(1..669) 235 242 GCTGTGAA 6s mmu-miR-27b 10111110 0.701550222027332
    XM_981806|TR(1..1171)CDS(1..669) 235 242 GCTGTGAA 6s mmu-miR-27a 10111110 0.701550222027332
    XM_981806|TR(1..1171)CDS(1..669) 340 347 GCAGGGAT 6s mmu-miR-670 10000000 0.215965695719154
    XM_981806|TR(1..1171)CDS(1..669) 341 348 CAGGGATG 6s mmu-miR-188-5p 10000000 0.0197476101385623
    XM_981806|TR(1..1171)CDS(1..669) 235 242 GCTGTGAA 6e mmu-miR-673-5p 10111110 0.388984091201355
    [sarah@poseidon fichier_db]$

  14. #14
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Pour supprimer les doublons de ton array, tu peux utiliser un hash.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    open (LIRE, "mm_targets_FullList.txt") || die "Pbl ouverture fichier LIRE";
    my %liste;
    my $ligne;
    while ($ligne = <LIRE>)
    {	#je dois recuperer tous les champ pour plutard
            my ($acc,$cds,$start_mir,$end_mir,$seq_mir,$mir);
    	$acc="";$cds="";$start_mir="";$end_mir="";$seq_mir="";$mir="";
    	chomp $ligne;
    	$ligne=~ s/ +/ /g;
    	$ligne=~ s/\|TR.+CDS/ CDS/g;
    	for ($ligne=~ m/.+/)
    	{	my $lig;
    		my @lig= split(' ',$ligne);
    		$acc=$lig[0];$cds=$lig[1];$start_mir=$lig[2];$end_mir=$lig[3];$seq_mir=$lig[4];$mir=$lig[6];
    		$liste{$acc}=1;
    	}
    }
    close LIRE;
     
    foreach my $acc (keys %liste)
    {
    ...
    Alors, pour la troisième (et dernière fois!!!!)
    Remplace
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $sequence = $db -> get_Seq_by_id($id);
    Par
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    my $sequence = $gb -> get_Seq_by_acc($id);
    Tu ferais d'ailleurs mieux de renommer correctement ta variable $id par $acc




    Pour la seconde (et dernière fois)
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    my $db = new Bio::DB::RefSeq;
    Doit être (si tu veux interroger Genbank)
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    my $db = new Bio::DB::GenBank;
    Prends au moins la peine de corriger ton code en fonction de mes remarques ... sinon comment veux-tu qu'il fonctionne?
    -- Jasmine --

  15. #15
    Membre à l'essai
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 15
    Points : 15
    Points
    15
    Par défaut
    je suis d'accord avec toi pour bien note mes variable
    je suis aussi d'accord avec toi pour
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    my $sequence = $gb -> get_Seq_by_acc($id);
    j'ai pas trop fai attention entre le get_Seq_by_acc et get_Seq_by_id vu qu'il me donnée le meme resultat
    mais je suis d'acord avec toi vu le context

    et consernat GenBank et RefSeq:
    avec RefSeq il me donne pas l'erreur suivant:
    -------------------- WARNING ---------------------
    MSG: [gb|NM_001001565] is not a normal sequence entry but a RefSeq entry. Redirecting the request.
    ---------------------------------------------------
    j'ai donc laisser RefSeq

    mais les deux donne le meme resultat
    mais si pour des raisons que je connais pas je laisse GenBank

  16. #16
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Tant mieux; si tout fonctionne comme tu le désir.

    j'ai pas trop fai attention entre le get_Seq_by_acc et get_Seq_by_id vu qu'il me donnée le meme resultat
    get_Seq_by_id donne souvent la même réponse que get_Seq_by_acc mais pas toujours, fais attention.


    et consernat GenBank et RefSeq:
    avec RefSeq il me donne pas l'erreur suivant:
    -------------------- WARNING ---------------------
    MSG: [gb|NM_001001565] is not a normal sequence entry but a RefSeq entry. Redirecting the request.
    ---------------------------------------------------
    j'ai donc laisser RefSeq
    Si tous tes acc sont de la forme NM_001001565 et doivent être redirigés, tu peux utiliser RefSeq.
    Par contre, pour un acc comme AY347556, seul genBank fonctionnera et RefSeq ne fonctionnera pas.
    J'utilise toujours GenBank qui me récupère tous les acc quelque soit leur forme.

    D'ailleurs
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
            else 
           #je recuper les sequence quil a pas trouver et jairai les chercher manuellement
    	{	print "$id\n" ;}
    Utiliser get_Seq_by_acc ne permettrait il pas de récupérer toutes tes séquences et d'éviter ce else?







    Dans ton script, je pense que
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    use strict; 
    use Bio::DB::RefSeq;
    suffisent.
    -- Jasmine --

  17. #17
    Membre à l'essai
    Profil pro
    Inscrit en
    Juin 2008
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2008
    Messages : 15
    Points : 15
    Points
    15
    Par défaut
    Citation Envoyé par Jasmine80 Voir le message
    D'ailleurs
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
            else 
           #je recuper les sequence quil a pas trouver et jairai les chercher manuellement
    	{	print "$id\n" ;}
    Utiliser get_Seq_by_acc ne permettrait il pas de récupérer toutes tes
    en fait ce else je l'ai mise pour avoir le acc qui n'existe pas dans la base de bonnée (il ce peut qu'il a été supremer momentanement pour correction mais que l'anceinne sequence est tjr afficher sur le site NCBI
    comme par exemple le acc NM_027567
    regarde la remarque en rouge sur ce lien
    http://www.ncbi.nlm.nih.gov/entrez/v...e&id=142352460

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. ADO.NET Requete SQL sur fichier Access
    Par doc_tah dans le forum ADO.NET
    Réponses: 4
    Dernier message: 09/08/2010, 10h18
  2. requete sql sur des dates
    Par dcaille dans le forum MS SQL Server
    Réponses: 2
    Dernier message: 29/10/2009, 11h00
  3. requete sql sur des dates
    Par dcaille dans le forum MS SQL Server
    Réponses: 2
    Dernier message: 27/10/2009, 17h52
  4. requete update sur base access
    Par neuneu1 dans le forum Bases de données
    Réponses: 13
    Dernier message: 23/09/2009, 18h47
  5. Requetes portant sur des champs vides
    Par Pucho dans le forum Requêtes et SQL.
    Réponses: 3
    Dernier message: 18/10/2007, 22h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo