Précédent   Forum des professionnels en informatique > PHP > Bibliothèques et frameworks
Bibliothèques et frameworks Forum d'entraide sur les frameworks, templates, bibliothèques de code (PDFLib, eZPdf, JpGraph, Artichow, PEAR, etc). Avant de poster : FAQ bibliothèques, toutes les FAQ PHP et cours bibliothèques
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 12/04/2007, 11h04   #1
Membre du Club
 
Inscription : mai 2006
Messages : 142
Détails du profil
Informations forums :
Inscription : mai 2006
Messages : 142
Points : 54
Points : 54
Par défaut [cURL] option CURLOPT_HTTPHEADER

bonjour,
je récupère une page au format web qui est au format utf-8 avec curl.
je l'enregistre dans un fichier txt et là je me retrouve avec un caractère plutot étrange au début mais qui ne s'affiche pas.
je m'explique quand j'ouvre le fichier dans ultraedit en hexa je trouve  au début et ça donne EF BB BF en hexa.
est ce que quelqu'un voit d'où peut venir mon problème?
je pense que je dois modifier le CURLOPT_HTTPHEADER mais comment?
posez moi des questions si ce n'est pas clair.
merci bcp
yanice est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/04/2007, 12h13   #2
En attente de confirmation mail
 
Inscription : juin 2002
Messages : 6 164
Détails du profil
Informations forums :
Inscription : juin 2002
Messages : 6 164
Points : 6 404
Points : 6 404
Citation:
Envoyé par yanice
je pense que je dois modifier le CURLOPT_HTTPHEADER mais comment?
Pourquoi CURLOPT_HTTPHEADER, ne serait-cas pas CURLOPT_HEADER ? Auriez-vous un code à nous montrer ? Ce caractère pourrait très bien venir de la page d'origine : auriez-vous vérifié par un autre moyen ?
julp est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/04/2007, 12h25   #3
Membre du Club
 
Inscription : mai 2006
Messages : 142
Détails du profil
Informations forums :
Inscription : mai 2006
Messages : 142
Points : 54
Points : 54
déjà merci davoir répondu, 3jours que je galère jen dors plus!!
pour le CURLOPT_HTTPHEADER je l'ai forcé en utf-8 mais rien à faire.
la page d'origine est propre, c'est moi même qui l'ai écrite.
j'ai fait un test en local et le caractère n'apparait pas.
une autre précision, j'insère le code de ma page dans une base mysql, d'où le mysql_real_escape_string() ca peut venir de là?
Code :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 0);
$this_header = array(
    "MIME-Version: 1.0",
    "Content-type: text/html; charset=utf-8",
    "Content-transfer-encoding: text",
    "Accept-Language: fr"
);
curl_setopt($ch, CURLOPT_HTTPHEADER, $this_header);
$recup_html=curl_exec($ch);
curl_close($ch);
 
//échappement des caractères pour insertion dans la base
$recup_html=mysql_real_escape_string($recup_html);
$recup_html=trim($recup_html);
 
$fp=fopen("nl.txt","a+");
echo fputs($fp,$recup_html);
fclose($fp);
encore merci de votre aide
yanice est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 27/03/2009, 18h13   #4
Invité de passage
 
Inscription : mars 2009
Messages : 3
Détails du profil
Informations forums :
Inscription : mars 2009
Messages : 3
Points : 3
Points : 3
Par défaut BOM tag UTF8

Ca ne vient pas du mysql_escape_string.

Il s'agit du BOM tag UTF8. C'est normal de l'avoir dans la plupart des fichiers UTF8.
http://www.websina.com/bugzero/kb/unicode-bom.html

S'il t'embête, un bête substr(3, $html) devrait suffire.
gabouel est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 13h21.


 
 
 
 
Partenaires

Hébergement Web