Bonjour,

Je souhaite extraire les métas et le plaintext (texte html) d'une url, je coince en recherchant la version fr de l'url

Initialement j'ai

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
$ch = curl_init();
	curl_setopt($ch, CURLOPT_URL, $url);
	curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
	curl_setopt($ch, CURLOPT_HEADER, 0);
	curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
	curl_setopt($ch, CURLOPT_AUTOREFERER, 1);
	curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
	curl_setopt($ch, CURLOPT_MAXREDIRS, 5);
	curl_setopt($ch, CURLOPT_TIMEOUT, 15);
	curl_exec($ch);
 
	// ensuite , je fais divers manip pour récupérer la bonne url (s'il y a des redirections htaccess ou meta refresh)
 
// +-------- Y a t'il une redirection -------------+
 
	$lastUrl = curl_getinfo($ch, CURLINFO_EFFECTIVE_URL); 
 
        if ($lastUrl != ""){
	$url = "$lastUrl";
	}
	else{ 
	$url ="$url";
	}
 
// +-------- Je vérifie s'il n'y a pas une redirection par un méta refresh... -------------+
 
	preg_match("'<meta[\s]*http-equiv[^>]*?content[\s]*=[\s]*[\"\']?\d+;[\s]*URL[\s]*=[\s]*[\"\']?([^\"\']*?)[\"\']?>'i", file_get_contents($url), $matches); 
	$refresh = $matches[1];
 
//etc..........et j'ai  une nouvelle $url nettoyée de tout
j'arrive donc à une nouvelle url, de cette nouvelle url j'aimerais donc extraire les informations que j'ai besoin, mais avant, je dois être certain
d'être sur la version fr du site (par exemple http://instagram.com/)

Avec cette adresse/url, je récupère les métas et le texte html, malheureusement en anglais et je souhaiterais les récupérer mais en français

j'essaye de faire ceci

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
$headers = array(
    'Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7',
    'Accept-Language: fr-FR,fr;q=0.5',
	);
 
	$url = curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);

Et comme ce bout de code doit être faux, ma varaible $url devient vide

Avez-vous une idée sur mon/mes erreur(s) ?

D'avance merci
Yule