Extraction d'URL avec preg_match_all()
Salut !
Je voudrais savoir comment je pourrais adapter le code ci-dessous pour extraire des urls d'un fichier HTML sans qu'il y ait de doublons:
Code:
1 2 3 4 5 6 7 8
|
<?php
$contenu = ... ; // Le contenu du fichier
$pattern = '`[a-zA-Z0-9_\.]+@[a-zA-Z0-9\-]+\.[a-zA-Z0-9\-\.]+`m';
preg_match_all($pattern, $contenu, $emails);
var_dump($emails[0]);
?> |
Merci d'avance
Stéphane
Extraction d'URL avec preg_match_all()
Merci j'ai trouvé un code qui le fait :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
|
<?
$url = "http://google.com";
if (isset($url))
{
// ICI JE ME CONNECTE AU SITE POUR EN PRENDRE LE CONTENU HTML
//SAUVE DANS $google_search
$google_search = implode("",file("google_search.txt"));
$urlpattern = "/<a[^>]+href=\"([^\"]+)/i";
preg_match_all($urlpattern, $google_search, $matches);
printf("Output of URLs %d URLs<P>n", sizeof($matches[1]));
foreach ($matches[1] as $u)
{
echo $u."<br>";
}
}
?> |
Encore merci Nesmontou :D :D :D :D :D !