compatibilité loadhtml et utf-8
Bonjour,
J'ai besoin d'utiliser un objet DomXpath pour analyser des pages HTML
Pour cela j'utilise les lignes de codes suivants :
Code:
1 2 3 4
|
$dom = new DomDocument;
@$dom -> loadHTML($url_content);
$xpath = new DomXPath($dom); |
$url_content est le contenu d'une page web récupéré via CURL
Cela fonctionne bien mis à part sur quelques sites (pas tous) en UTF-8 où le loadhtml retourne un fichier vide (sans erreur particulière)
Le problème est comme je l'ai deja dit plus haut ce n'est pas systématique : pour la plupart des sites en UTF-8 cela fonctionne
Quelque'un a t-il un retour d'expérience similaire ? et/ou une solution pour l'aider ?
d'avance merci