Expression régulière et URL
Bonjour à tous,
voici mon problème.
Je n'arrive pas à comprendre ou est l'erreur dans mon expression régulière :?
J'aimerai en fait trouver tous les liens d'une page html des fichiers de type gz ou bz2. Voici ce que j'ai pour le moment (avec des affichages tests) :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14
|
$regex='/"((ht|f)tp:\/\/.*.(bz2|gz))">/';
$fichier=$ARGV[0];
open(FICHIER, "<$fichier") or die "Impossible de lire le fichier";
$n=0;
while (<FICHIER>) {
if ($regex) {
print "$1--$n\n";
$n++;
}else{
print "RIEN\n";
}
}
close(FICHIER); |
Ce que j'obtiens au final c'est l'affichage de toutes les lignes du fichiers mais vides!
--0
--1
--2
--3
--4
--5
--6
--7
--8
--9
--10
--11
--12
--13
etc
Je fais le test avec cette page ci : http://lfs.traduc.org/view/lfs-6.4-f.../packages.html
Quelqu'un aurait trouvé le problème?