|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | ||
|
Membre du Club
![]() Inscription : juin 2005 Messages : 255 ![]() |
Bonjour,
j'ai codé une routine qui récupère via xpath et domdocument du contenu mixte (arabe et français mélangés) d'un site externe (légal hein ^^) dont les pages sont encodée en windows-1256. Je traite ensuite les données pour les convertir en utf8, et c'est là que j'ai un problème: les caractères arabes sont transformé en caractère spéciaux html sauf le texte en français: Code :
Racisme php ?
__________________
Je créer des sites web et je ne suis fan de voiture teintée et tout ce qui à trait au tuning: customisation, kit xenon, vitres teinté voiture et course automobile. |
||
|
|
00
|
|
|
#2 |
|
En attente de confirmation mail
![]() Inscription : juin 2002 Messages : 6 164 ![]() |
Il ne faudrait peut être pas oublier de consulter la documentation : les fonctions html_entity_decode, htmlentities, htmlspecialchars, à moins de leur indiquer le charset via l'argument prévu, considèrent les données comme étant encodées en ISO-8859-1. Sinon, il ne faut pas s'étonner du résultat ...
Cependant, quel intérêt à encoder les caractères en entités HTML, surtout quand on utilise justement Unicode ? (et pour rappel, DOM comme toute extension basée sur libxml2, attend/renvoie de l'UTF-8) |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com