bonjour
je cherche à recuperer le source HTML de ce qui affiché à l'ecran connaissant l'url,
en PHP et sous forme de fichier
dans la pluspart des cas, ca fonctionne bien,
soit avec
$file_src = file_get_contents($my_url );
soit avec
1 2 3
| $fp=@fopen($my_url,"r");
if($fp)
{ while(!feof($fp)) { $file_src .= fgets($fp,1024); } } |
soit encore, avec un appel de fonction CURL
Cependant , pour quelques cas, ca ne fonctionne pas :
le fichier obtenu par l'une des 3 methodes precedentes n'est pas le meme que le fichier obtenu en faisant Ctrl U à l'ecran ( je suis sous google chrome)
deux exemples où ça ne coïncide pas :
http://www.econologie.com/forums/cha...on-vt7103.html
et
acheter une maison ecologique - Recherche Google
Dans le premier cas , par programmation, le fichier est réduit à
1 2 3 4 5
| <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
<html><head> <title>403 Forbidden</title> </head>
<body> <h1>Forbidden</h1>
<p>You don't have permission to access /forums/chauffage-bois-et-pollution-vt7103.html on this server.</p>
</body></html> |
dans le deuxieme cas , le fichier est presque egal au vrai source, mais pas tout à fait
Savez vous pourquoi ils sont différents ?
et
aussi comment récupérer le vrai source ? ?
Merci de vos reponses
Partager