Bonjour,

J'aimerais retrouver des informations sur une page du net.
Je recherche la bonne page que j'ouvre et lis.


La page

http://www.ncbi.nlm.nih.gov/entrez/v...&val=115385275

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
<div class='recordbody'><div class="sequence"><a name="locus_115385275"></a><div class="localnav"><ul class="locals"><li><a href="#comment_115385275" title="Jump to the comment section of this record">Comment</a></li><li><a href="#feature_115385275" title="Jump to the feature table of this record">Features</a></li><li><a href="#sequence_115385275" title="Jump to the sequence of this record">Sequence</a></li></ul></div>
<pre class="genbank">LOCUS       XM_001209185            3771 bp    mRNA    linear   PLN 28-SEP-2006
DEFINITION  Aspergillus terreus NIH2624 DNA-directed RNA polymerase II 138 kDa
            polypeptide (ATEG_01820) mRNA, complete cds.
ACCESSION   XM_001209185
VERSION     XM_001209185.1  GI:115385275
KEYWORDS    .
SOURCE      Aspergillus terreus NIH2624
  ORGANISM  <a href=http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=341663>Aspergillus terreus NIH2624</a>
            Eukaryota; Fungi; Ascomycota; Pezizomycotina; Eurotiomycetes;
            Eurotiales; Trichocomaceae; mitosporic Trichocomaceae; Aspergillus.
REFERENCE   1  (bases 1 to 3771)
  AUTHORS   Birren,B., Lander,E., Galagan,J., Nusbaum,C., Devon,K., Henn,M.,
            Ma,L.-J., Jaffe,D., Butler,J., Alvarez,P., Gnerre,S., Grabherr,M.,
            Kleber,M., Mauceli,E., Brockman,W., Rounsley,S., Young,S.,
            LaButti,K., Pushparaj,V., DeCaprio,D., Crawford,M., Koehrsen,M.,
            Engels,R., Montgomery,P., Pearson,M., Howarth,C., Larson,L.,
            Luoma,S., White,J., Alvarado,L., Kodira,C., Zeng,Q., Oleary,S.,
            Yandava,C., Denning,D., Nierman,B., Milne,T. and Madden,K.
  CONSRTM   The Broad Institute Genome Sequencing Platform
  TITLE     Annotation of the Aspergillus terreus NIH2624 genome
  JOURNAL   Unpublished
REFERENCE   2  (bases 1 to 3771)
  AUTHORS   Birren,B., Lander,E., Galagan,J., Devon,K., Nusbaum,C., Henn,M.,
            Borowsky,M., Jaffe,D., Butler,J., Alvarez,P., Gnerre,S.,
            Grabherr,M., Kleber,M., Mauceli,E., Brockman,W., Rounsley,S.,
            Young,S., LaButti,K., Pushparaj,V., DeCaprio,D., Crawford,M.,
            Koehrsen,M., Engels,R., Montgomery,P., Pearson,M., Howarth,C.,
            Kodira,C., Zeng,Q., Yandava,C., Oleary,S. and Alvarado,L.
  TITLE     Direct Submission
  JOURNAL   Submitted (02-SEP-2005) Broad Institute of MIT and Harvard, 320
            Charles Street, Cambridge, MA 02141, USA
REFERENCE   3  (bases 1 to 3771)
  AUTHORS   Denning,D. and Anderson,M.
  TITLE     Direct Submission
  JOURNAL   Submitted (02-SEP-2005) The University of Manchester, Oxford Road,
            Manchester M13 9PT, UK
REFERENCE   4  (bases 1 to 3771)
  AUTHORS   Nierman,W.C.
  TITLE     Direct Submission
  JOURNAL   Submitted (02-SEP-2005) The Institute for Genomic Research, 9712
            Medical Center Drive, Rockville, MD 20850, USA
<a name="comment_115385275"></a>COMMENT     PROVISIONAL <a href=http://www.ncbi.nlm.nih.gov/RefSeq/>REFSEQ</a>: This record has not yet been subject to final



Je voudrais retrouver tous les articles


Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
                my %Reference = "";
                my %Auteurs = "";
                my %Titre = "";
                my %Journal = "";
                my $Html = get("http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=$Gi")or print "IMPOSSIBLE D OUVRIR LA PAGE\n";
 
                my $a = 0;
 
                if ($Html =~ /\s*REFERENCE/)
                {
                        $a++;
                        ($Reference{$a}) = ($Html =~ /\s*REFERENCE\s*([\w\(\)\s]+)\n/);
                        ($Auteurs{$a}) = ($Html =~ /\s*AUTHORS\s*([\w\(\)\,\.]+)\ /); # ne prend que le premier nom
                        ($Titre{$a}) = ($Html =~ /\s*TITLE\s*([\w\(\)\s]+)\n/);
                        ($Journal{$a}) = ($Html =~ /\s*JOURNAL\s*([\w\(\)\s\-]+)\n/);
                        print "\n $a Ref $Reference{$a} \tAut $Auteurs{$a} \tTit $Titre{$a} \tJou $Journal{$a} FIN\n\n\n";
                }

J'obtiens

1 Ref 1 (bases 1 to 3771) Aut Birren,B., Tit Annotation of the Aspergillus terreus NIH2624 genome
JOURNAL Unpublished
REFERENCE 2 (bases 1 to 3771) Jou Unpublished
REFERENCE 2 (bases 1 to 3771) FIN

J'ai essayé avec le module WWW::Search de PubMed mais je dois retrouver les articles référencés pour un Gi bien particulier et non des articles trouvés par une requête générale. Si j'utilise le Gi comme mot clé pour la recherche dans PubMed, je ne retrouve évidemment que les articles publiés or j'aimerais récupérer toutes les références présentes sur la page citée plus haut.

Merci beaucoup,


Jasmine,