中文与韩、日文混排出现在Gb2312编码的Aspx的处理方法

最新推荐文章于 2025-12-02 22:10:11 发布

转载最新推荐文章于 2025-12-02 22:10:11 发布 · 985 阅读

文章标签：

本文介绍了一种解决中文、韩文及日文混合内容在GB2312编码下出现乱码的方法，通过将特殊字符转换为HTML实体来确保跨编码兼容性。

有一个Web项目，Web.Config中requestEncoding和responseEncoding都是gb2312，而从数据库中取出的简介数据可能是中文和韩、日文混合的内容，这时候如果直接输出到页面上，其页面会出现乱码，其中的韩文内容无法正确显示。当然如果项目的编码都使用Utf-8的话将没有这个问题，但这个项目是一个老项目，为了尽量不要影响已有的程序，所以无法将编码改为Utf-8,只能在本页面上动脑筋。

经过研究，发现这个问题可以通过Html实体的方法解决。

对于Html实体请参考：

Character entity references in HTML 4

HTML Document Representation

测试代码：

Byte[] bComments = Encoding.UTF8.GetBytes("一ンブル????中文");
   char[] cComments = Encoding.UTF8.GetChars(bComments);

   StringBuilder charBuilder = new StringBuilder();
   foreach(char c in cComments)
   {
    if(c > ’/u0800’)
    {
     charBuilder.Append("&#");
     charBuilder.Append((int)c);
    }
    else
    {
     charBuilder.Append(c);
    }
   }
   Response.Write(charBuilder.ToString());