bonjour,
J'aimerai me constituer une liste de lien qui se trouvent sur une page afin de l'exploiter par la suite.
donc cela consiste à chercher une chaine de caractère spécifique contenant le lien href et de la stocker.
Jusqu'à maintenant, je suis arrivé à faire ca :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
 
<?
 
$page ='';
$geoLecture = fopen('http://www.tageo.com/index.htm', 'r') or die($php_errormsg);
$geoEcritureLien = fopen('listeLien_geo.txt', 'w') or die($php_errormsg);
 
 
while (! feof($geoLecture)) {
	$page = fread($geoLecture, 1048576);
	while (ereg("href=\"alpha+\"", $page, $lien)) {
		fwrite($geoEcritureLien, $page);
	}
}
 
 
 
 
?>
est ce que l'expression régulière vous semble correcte ?
la boucle marcherait vraiment dans ce cas la ? j'aimerai faire en sorte que tant qu'il y a des chaines de caractères qui repondent à l'expression, le traitement continue.
Pour une utilisation ultérieur, j'aimerai ne pouvoir stocker que le texte du lien. Par exemple pour http://www.monlien.com j'aimerai ne stocker que ce texte et non href="http://www.monlien.com".

Vous avez une astuce ?


Merci d'avance pour toute réponse

Sempire