IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

chinois charset gb2312 , non utf-8 ?


Sujet :

Langage PHP

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Juillet 2008
    Messages
    24
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2008
    Messages : 24
    Points : 15
    Points
    15
    Par défaut chinois charset gb2312 , non utf-8 ?
    bonjour

    je travaille sur un site avec des parties en chinois

    le site est entierement utf-8 , avec
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
    <META http-equiv="Content-Language" content="fr">
    <meta http-equiv="Content-type" content="text/html; charset=utf-8">
    les fichiers php sont produits avec notepad option "encoder en utf-8 sans BOM"

    et (pour l'instant) les textes en chinois sont des copies-collés de traductions du français obtenues avec google traduction ,
    inserés via php dans la bd MySql
    ( champs varchar en utf8_unicode_ci et instruction mysql_set_charset ('utf8') ; à l'ouverture de la base )

    jusque là tout va bien, les ideogrammes chinois s'inserrent et s'affichent parfaitement

    le probleme : je dois recuperer des textes chinois en provenance de sites webs chinois , qui n'ont pas le meme systeme de codage

    ex : le charset gb2312 ( chinois simplifié, tres utilisé)

    <meta http-equiv="content-type" content="text/html;charset=gb2312">
    <title>百度搜索_中国最美丽的城市 </title>

    à l'ecran ( google chrome , ie, .. ) , les idéogrammes apparaissent correctement , idem en visualisant le source des pages web

    par contre si je fais un copie collé et le met dans notepad

    --> encodage UTF-8 sans bom : les ideogrammes se changent en une suite de rectangle

    --> encodage ISO- : les ideogrammes deviennent : ????_????????

    --> les autres options "codage de caractere" , nada, cela donne rien

    J'ai essayé en sauvegardant d'abord le source avan de l'ouvrir sous notepad ( unicode par defaut)
    idem des rectangles

    Par contre en ouvrant le fichier sauvegardé sous word, alors là ca marche, mais plus ou moins :
    plus : word met 10 minutes à ouvrir le fichier, le resultat est visiblement correct , la police de caractere est SimSun

    moins : je ne peux toujours rien en faire !

    ---------------
    pour essayer de comprendre, j'ai tenté un autre truc : recuperer le source par curl et l'afficher
    ( apres avoir enlevé les balises) à l'ecran

    tel quel : les idéogrammes donnent qq chose du genre °Ù¶ÈËÑË÷_Îҵķ¨¹ú³µ

    et sur plusieurs morceaux de texte , l'instruction
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
      $text =  iconv(  "gb2312",  "utf-8", $text) ;
    donne soit rien pour certain, soit un seul ideogramme pour d'autres

    ------------

    est ce que vous savez quel est le probleme et ce que je devrai faire ?

    merci de votre aide

  2. #2
    Membre à l'essai
    Profil pro
    Inscrit en
    Juillet 2008
    Messages
    24
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2008
    Messages : 24
    Points : 15
    Points
    15
    Par défaut
    qu'est ce que je dois faire ? j'chais pas quoi faire

Discussions similaires

  1. Réponses: 8
    Dernier message: 05/02/2015, 17h02
  2. Réponses: 0
    Dernier message: 16/07/2013, 09h39
  3. [Web Service] Client SOAP, page chinois et exception non déclencher
    Par waldoun dans le forum Bibliothèques et frameworks
    Réponses: 2
    Dernier message: 25/05/2010, 09h48
  4. Pb enreg UTF-8 sur BDD non UTF-8
    Par RobinNono dans le forum ASP
    Réponses: 4
    Dernier message: 09/09/2008, 14h48
  5. Problème d'affichage des caratères non UTF-8
    Par tit_pierre dans le forum Langage
    Réponses: 1
    Dernier message: 07/09/2006, 23h11

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo