récuperation de source HTML

**zephira** · 12/01/2012, 15h27

bonjour

je cherche à recuperer le source HTML de ce qui affiché à l'ecran connaissant l'url,
en PHP et sous forme de fichier

dans la pluspart des cas, ca fonctionne bien,

soit avec

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

 $file_src = file_get_contents($my_url );

soit avec

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
 $fp=@fopen($my_url,"r");
                if($fp)    
			  {   while(!feof($fp)) { $file_src  .= fgets($fp,1024);  } }

soit encore, avec un appel de fonction CURL

Cependant , pour quelques cas, ca ne fonctionne pas :

le fichier obtenu par l'une des 3 methodes precedentes n'est pas le meme que le fichier obtenu en faisant Ctrl U à l'ecran ( je suis sous google chrome)

deux exemples où ça ne coïncide pas :

http://www.econologie.com/forums/cha...on-vt7103.html

et

acheter une maison ecologique - Recherche Google

Dans le premier cas , par programmation, le fichier est réduit à

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
 <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> 
<html><head> <title>403 Forbidden</title> </head>
<body> <h1>Forbidden</h1>
 <p>You don't have permission to access /forums/chauffage-bois-et-pollution-vt7103.html on this server.</p> 
</body></html>

dans le deuxieme cas , le fichier est presque egal au vrai source, mais pas tout à fait

Savez vous pourquoi ils sont différents ?

et
aussi comment récupérer le vrai source ? ?

Merci de vos reponses

récuperation de source HTML

Langage PHP

Mode arborescent

Discussions similaires

Partager

Partager