Bonjour,
J'ai écrit un programme ouvrant des pages html, en copiant le contenu dans un fichier texte puis lisant celui ci ligne par ligne pour y reprendre des informations.
Cela fonctionne très bien pour certaines pages mais pas pour d'autres.
Les fichiers textes intermédiaires sont toujours bien complets, mais quand mon script les parcourts, il ne va pas jusqu'au bout. Pourant ces fichiers textes semblent identiques Avez-vous une idée?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17 my $Gi = 85070119; # 63099837 OK my $Html = get("http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=$Gi")or print "IMPOSSIBLE D OUVRIR LA PAGE\n"; my $OutFile = FileHandle->new (">P:/Perl/scripts/Files/Articles.txt"); my $InFile = "P:/Perl/scripts/Files/Articles.txt"; print $OutFile ($Html); open (InFile,$InFile) or die "Can't open File file\n"; my $Articles = ""; my $LiensArticles = ""; my $Ligne; my $Ok = 0; my $URL = ""; # (DEFINITION[.\n]+)\n<a name=" while ($Ligne=<InFile>) { print "$Ligne\n"; }
Cela fonctionne pour gi = 63099837 mais pas pour gi = 85070119
Alors que les fichiers textes contiennent bien toute la page récupérée, la lecture de ces fichiers s'arrête pour g= 85070119
gi = 63099837
gi = 85070119<div class='recordbody'><div class="sequence"><a name="locus_63099837"></a><div class="localnav"><ul class="locals"><li><a href="#feature_63099837" title="Jump to the feature table of this record">Features</a></li><li><a href="#sequence_63099837" title="Jump to the sequence of this record">Sequence</a></li></ul></div>
<pre class="genbank"><div class='recordbody'><div class="sequence"><a name="locus_63099837"></a><div class="localnav"><ul class="locals"><li><a href="#feature_63099837" title="Jump to the feature table of this record">Features</a></li><li><a href="#sequence_63099837" title="Jump to the sequence of this record">Sequence</a></li></ul></div>
<pre class="genbank">LOCUS AY944897 846 bp DNA linear PLN 28-FEB-2006
DEFINITION Absidia corymbifera strain FSU787 18S ribosomal RNA gene, partial
sequence; internal transcribed spacer 1, 5.8S ribosomal RNA gene,
and internal transcribed spacer 2, complete sequence; and 28S
ribosomal RNA gene, partial sequence.
<div class='recordbody'><div class="sequence"><a name="locus_85070119"></a><div class="localnav"><ul class="locals"><li><a href="#feature_85070119" title="Jump to the feature table of this record">Features</a></li><li><a href="#sequence_85070119" title="Jump to the sequence of this record">Sequence</a></li></ul></div>
<pre class="genbank">LOCUS DQ340176S2 232 bp DNA linear PLN 06-MAR-2006
DEFINITION Absidia corymbifera strain CBS 118994 18S ribosomal RNA gene,
partial sequence.
s'arrête en milieu de ligne juste après "DQ340176S2" et avant "232 bp DNA"
Sans aucun message d'erreur, comme si il avait simplement fini de lire le fichier.
<div class='recordbody'><div class="sequence"><a name="locus_85070119"></a><div class="localnav"><ul class="locals"><li><a href="#feature_85070119" title="Jump to the feature table of this record">Features</a></li><li><a href="#sequence_85070119" title="Jump to the sequence of this record">Sequence</a></li></ul></div>
<pre class="genbank">LOCUS DQ340176S2
Merci,
Jasmine,
Partager