IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Encodage caractère arabes


Sujet :

Langage PHP

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Juin 2005
    Messages
    256
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2005
    Messages : 256
    Points : 75
    Points
    75
    Par défaut Encodage caractère arabes
    Bonjour,

    j'ai codé une routine qui récupère via xpath et domdocument du contenu mixte (arabe et français mélangés) d'un site externe (légal hein ^^) dont les pages sont encodée en windows-1256. Je traite ensuite les données pour les convertir en utf8, et c'est là que j'ai un problème: les caractères arabes sont transformé en caractère spéciaux html sauf le texte en français:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    $texte='bonjour إن تفسير ابن';
    echo $texte = utf8_encode(html_entity_decode(getContentHTML($desc), ENT_QUOTES));
    Je ne vois pas pourquoi la fonction html_entity_decode ne decode pas les entités html arabes ?

    Racisme php ?
    Je créer des sites web et je ne suis fan de voiture teintée et tout ce qui à trait au tuning: customisation, kit xenon, vitres teinté voiture et course automobile.

  2. #2
    Expert éminent sénior

    Profil pro
    Inscrit en
    Juin 2002
    Messages
    6 152
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2002
    Messages : 6 152
    Points : 17 778
    Points
    17 778
    Par défaut
    Il ne faudrait peut être pas oublier de consulter la documentation : les fonctions html_entity_decode, htmlentities, htmlspecialchars, à moins de leur indiquer le charset via l'argument prévu, considèrent les données comme étant encodées en ISO-8859-1. Sinon, il ne faut pas s'étonner du résultat ...

    Cependant, quel intérêt à encoder les caractères en entités HTML, surtout quand on utilise justement Unicode ? (et pour rappel, DOM comme toute extension basée sur libxml2, attend/renvoie de l'UTF-8)

Discussions similaires

  1. Encodage des caractères arabes
    Par elabadiabdelmoula dans le forum Balisage (X)HTML et validation W3C
    Réponses: 6
    Dernier message: 21/01/2013, 19h09
  2. Importer des données Excel: Probleme Encodage Caractères Arabe
    Par hasary dans le forum EDI, CMS, Outils, Scripts et API
    Réponses: 8
    Dernier message: 31/05/2009, 13h05
  3. [Multi-langue] Caractère arabe
    Par Mister Nono dans le forum Débuter
    Réponses: 3
    Dernier message: 01/11/2005, 15h33
  4. Caractère Arabe en delphi
    Par da_latifa dans le forum Bases de données
    Réponses: 5
    Dernier message: 09/09/2005, 13h22
  5. [JSP] Encodage caractère
    Par tscoops dans le forum Servlets/JSP
    Réponses: 2
    Dernier message: 08/02/2005, 09h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo