Bonjour,
j'utilise un petit programme en java pour extraire le contenu d'une page html en un fichier texte.
Le seul problème est que les caractères chinois extraits ne sont pas affichés correctement.
Le format utilisé dans les pages html est le gb2312.
Quelqu'un pourrait-il m'aider ?
Voici le genre de caractères que j'ai au lieu des caractères chinois :
£ÕâÏîÑо¿ÊÇÓÉũί»á¶ÀÁ¢Íê³É£¬Ïà¹ØÑо¿ÈËÔ±Ôøµ½Ó¢¹úÊÜѵ£¬Ç°ºó·ÑʱÆß¡¢°ËÄê¡£Àî½ðÁú±íʾ£¬ÕâÏî¼Æ»®¾*·Ñ²»µ½ÐĄ̂±ÒÒ»ÒÚÔª£¬µ«ÒòÄ¿±êÕýÈ·£¬³É¹ûÏ൱¾ªÈË¡£
¾ÝÏã¸ÛÎĻ㱨±¨µÀ£¬Ì¨ÍåµÄ¶¯Îï¸´ÖÆ¿Æ¼¼ÓжÀ²½È«ÇòµÄÖØ´óÍ»ÆÆ£¡¡¸ÐÐÕþÔº¡¹Å©ÒµÎ¯Ô±»áÖ÷ίÀî½ðÁú26ÈÕ½ÓÊÜÖÐÑëÉçר·Ãʱ͸¶£¬Å©Î¯»á¾*¹ý¶àÄêŬÁ¦£¬³É¹¦Ñз¢¼æ¾ß¾*¼Ã¼ÛÖµÓëҽѧ¹¦Äܵ͝Îï¸´ÖÆ¼¼Êõ£¬ÀûÓÃÌåϸ°û¸´ÖÆ£¬´ú´úÑÓÐø¹Ø¼üµÄÉúÎï»ùÒò£»ÕâÏîÖØ´óÑо¿³É¹û¶À²½È«Çò£¬9Ô³õ½«ÓɳÂË®±âÕýʽÐû²¼¡£
ËûÖ¸³ö£¬¸´ÖƵIJ»ÊÇè¡¢¹·Ö®ÀàµÄ³èÎÕâÏî¸´ÖÆ¶¯Îï³ýÓо*¼Ã¼ÛÖµ£¬»¹¿ÉÒÔÓÐҽѧ¹¦ÄÜ£¬¿É°Ñ¿¹ÈéÌúµ°°×¡¢¿¹°×Ѫ²¡»ùÒòÖ²È룬´óÁ¿¸´ÖÆ¡£
Partager