Extraction d'URL avec preg_match_all()

Version imprimable

20/01/2007, 11h33
pdtor

Extraction d'URL avec preg_match_all()
Salut !

Je voudrais savoir comment je pourrais adapter le code ci-dessous pour extraire des urls d'un fichier HTML sans qu'il y ait de doublons:
Code:

1 2 3 4 5 6 7 8 <?php $contenu = ... ; // Le contenu du fichier $pattern = '`[a-zA-Z0-9_\.]+@[a-zA-Z0-9\-]+\.[a-zA-Z0-9\-\.]+`m'; preg_match_all($pattern, $contenu, $emails); var_dump($emails[0]); ?>
Merci d'avance

Stéphane
20/01/2007, 12h00
Nesmontou

Salut, regarde ma réponse dans ton post : http://www.developpez.net/forums/sho...d.php?t=266778 ;)

Merci j'ai trouvé un code qui le fait :

Code:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
 
 
<?
    $url = "http://google.com";
    if (isset($url)) 
   { 
 
    // ICI JE ME CONNECTE AU SITE POUR EN PRENDRE LE CONTENU HTML 
   //SAUVE DANS $google_search
 
    $google_search = implode("",file("google_search.txt"));
    $urlpattern = "/<a[^>]+href=\"([^\"]+)/i"; 
    preg_match_all($urlpattern, $google_search, $matches); 
    printf("Output of URLs %d URLs<P>n", sizeof($matches[1])); 
    foreach ($matches[1] as $u) 
    { 
	  echo $u."<br>";    
    } 
  } 
?>

Encore merci Nesmontou :D :D :D :D :D !