Servlet中文输出问题的原理
浏览器接收到的中文字符并不是中文符号本身,而是它的某种字符集编码的数据。
浏览器必须使用正确的字符集编码进行查看,才能将它所接收到的数据显示为正确的中文字符。当Servlet程序仅仅需要输出纯文本格式的响应正文时,通常应调用ServletResponse对象的getWriter方法返回一个PrintWriter对象,然后使用这个PrintWriter对象将文本内容写入到客户端。
Java程序中的字符文本在内存中是以unicode编码的形式存在的,PrintWriter对象在输出字符文本时,需要先将它们转换成其他某种字符集编码的字节数组后输出。
ServletResponse对象的getWriter方法返回的PrintWriter对象默认使用ISO8859-1字符集编码进行Unicode字符串到字节数组的转换,由于ISO8859-1字符集中根本就没有中文字符,Unicode编码的中文字符将被转换成无效的字符编码后输出给客户端。
Servlet中文输出问题的解决办法
ServletResponse接口中定义了setCharacterEncoding、setContentType等方法来指定ServletResponse.getWriter方法返回的PrintWriter对象所使用的字符集编码。
调用ServletResponse接口中定义的setContentType方法,在HTTP响应消息的Content-Type头字段中指定响应正文的字符集编码。
Servlet中文输出问题解析

本文详细解释了Servlet中文输出的问题原理及解决方案。浏览器接收到的中文字符需要正确的字符集编码才能正确显示。当Servlet程序输出中文时,默认使用ISO8859-1编码会导致乱码。文章介绍了如何通过设置正确的字符编码来解决这一问题。

被折叠的 条评论
为什么被折叠?



