bonjour,
J'aimerai me constituer une liste de lien qui se trouvent sur une page afin de l'exploiter par la suite.
donc cela consiste à chercher une chaine de caractère spécifique contenant le lien href et de la stocker.
Jusqu'à maintenant, je suis arrivé à faire ca :
est ce que l'expression régulière vous semble correcte ?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19 <? $page =''; $geoLecture = fopen('http://www.tageo.com/index.htm', 'r') or die($php_errormsg); $geoEcritureLien = fopen('listeLien_geo.txt', 'w') or die($php_errormsg); while (! feof($geoLecture)) { $page = fread($geoLecture, 1048576); while (ereg("href=\"alpha+\"", $page, $lien)) { fwrite($geoEcritureLien, $page); } } ?>
la boucle marcherait vraiment dans ce cas la ? j'aimerai faire en sorte que tant qu'il y a des chaines de caractères qui repondent à l'expression, le traitement continue.
Pour une utilisation ultérieur, j'aimerai ne pouvoir stocker que le texte du lien. Par exemple pour http://www.monlien.com j'aimerai ne stocker que ce texte et non href="http://www.monlien.com".
Vous avez une astuce ?
Merci d'avance pour toute réponse
Sempire
Partager