java web中contentType&pageEncoding、request&response及中文乱码问题
JSP页面编码:contentType&pageEncoding
pageEncoding是jsp文件本身的编码
contentType的charset是指服务器发送给客户端时的内容编码
JSP页面三个阶段使用编码
JSP要经过两次的“编码”:
第一阶段会用pageEncoding;
第二阶段会用utf-8;
第三阶段就是由Tomcat出来的网页, 用的是contentType。
JSP页面三种编码设置的方式
//1.
<%@page contentType="text/html" pageEncoding="UTF-8" language="java"%>
//2.
<%@ page contentType="text/html;charset=UTF-8" language="java" %>
//3.使用默认编码
JSP页面使用编码的顺序
1.pageEncoding属性
如果pageEncoding属性存在,那么JSP页面的字符编码方式就由pageEncoding决定,
2.contentType属性的charset
否则就由contentType属性中的charset决定,如果charset也不存在,JSP页面的字符编码方式就采用
3.默认编码ISO-8859-1
默认的ISO-8859-1。
服务器端编码
request.setCharacterEncoding("utf-8");
response.setContentType("text/html;charset=utf-8");
request.setCharacterEncoding()
request.setCharacterEncoding():是设置从request中取得的值或从数据库中取出的值。
(1)在getParameter()方法之前确定;
(2)且该指定只对POST方法有效,对GET方法无效。
分析原因:
(1)应该是在执行第一个getParameter()的时候,java将会按照编码分析所有的提交内容,而后续的getParameter()不再进行分析,所以setCharacterEncoding()无效。
(2)而对于GET方法提交表单是,提交的内容在URL中,一开始就已经按照编码分析提交内容,setCharacterEncoding()自然就无效。
get方法的参数问题
get需在Tomcat的server.xml中的:
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="GBK" />
加入URIEncoding=“GBK”,解决get请求乱码问题
response.setContentType(“text/html;charset=gb2312”):是设置页面中为中文编码。即以哪种编码返回给客户端。
前者是设置***动态文字***(参数,数据库),后者设置页面***静态文字***
JSP和Servlet的六种中文乱码处理方法
表单提交时出现乱码:
在进行表单提交的时候,经常提交一些中文,自然就避免不了出现中文乱码的情况,对于表单来说有两种提交方式:get和post提交方式。所以请求的时候便有get请求和post请求。每种方式都有着不同的解决方法,之所以出现乱码,原因就在于get请求时,其传递给服务器的数据是附加在URL地址之后的;而post的请求时,其传递给服务器的数据是作为请求体的一部分传递给服务器。这也就导致了对它们所产生的乱码的处理方式是不同的。
客户端的get请求
get提交时, 容器以容器的编码 来编码 如果用的tomcat 默认的编码是iso-8859-1 在(1)server.xml里面设置编码
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="GBK" />
(2)或者在服务端页面设置代码如下:
`String name = request.getPara...(``"name"``);``String strName = ``new` `String(name.getByte(``"iso-8859-1"``),``"GBK"``);`
对于不同的请求方式,解决乱码的问题也是不一样的。
对于客户端的get请求来说,服务器端处理要想不出现乱码,解决这个问题稍微复杂一些,需要用到String类型的构造函数,其中的一个构造函数就是用指定的编码方式去解码,一般都用“UTF-8”的方式。只要在服务器端将请求得到的参数重新构造成一个字符串就行了。
经过构造之后,客户端输入中文,且表单时get请求的情况下,str就变成了中文了。
客户端的post请求
对于客户端的post请求来说,处理乱码的问题就比较简单了,因为请求的数据时作为请求体的一部分传递给服务器的,所以只要修改请求内的编码就行了。只要在服务器端的最开始处将请求的数据设置为“UTF-8”就行了,输入如下语句:**request. setCharacterEncoding(“UTF-8”);**这样用户在服务器端获取到的中文数据就不再是乱码了。
超链接时出现乱码(低版本浏览器不行IE6)
在Web开发中,挺多的时候都是通过超链接去传递中文参数的,这也会导致在显示的时候也会出现乱码,对于超链接来说,它实际上是向服务器端发送了一个请求,而它发出的请求是属于get请求,所以对于超链接的乱码来说,它处理乱码的方式和表单的get请求出现乱码的方式是一样的。
重定向时出现乱码(低版本浏览器不行IE6)
有时写上response的sendRedirect方法进行重定向时也会出现乱码,重定向时实际上也是向服务器发送了一个请求,所以解决乱码的方法和和上面是一样的。
浏览器版本低导致的乱码
上网的时候,有时提交的一些信息在地址栏显示的是“%2C%C6%CC%C6”的字样,其实这都是防止出现乱码进行的解决方案,如果你的浏览器是IE6或以下版本,则我们的第二种情况和第三种情况会出现乱码(尤其是当中文是奇数的时候),这就不好使了所以我们必须采用另一种比较实际的作法:
在java.net包中提供了URLEncoder类和URLDcoder类,这两个类又分别提供了encode和decode两个静态方法,分别用于进行编码和解码。我们将要传递的中文参数进行编码之后,在传递给服务器,服务器解码之后,就可以显示中文了。
进行编码:URLEncoder.encode(stuname,”UTF-8”)
传递给服务器:<a href=”/1.jsp?stuname<%=stuname%>”>传递
进行解码:URLDecoder.decode(stuname,”UTF-8”)
返回浏览器显示的乱码
在Servlet编程中,经常需要通过response对象将一些信息返回给浏览器,给我们的客户端,而我们在服务器端显示的中文,但是响应给客户端浏览器却是乱码,这主要是由于response对象的getWriter()方法返回的PrintWriter对象默认使用“ISO-8859-1”字符集编码进行Unicode字符串到字节数组的转换,由于ISO8859-1字符集中根本就没有包含中文字符,所以Java在进行转换的时候会将无效的字符编码输出给客户端,于是便出现了乱码,为此ServletResponse接口中便定义了setCharacterEncoding、setContentType等方法来指定getWriter方法返回的PrintWriter对象所使用的字符集编码,所以我们在写Servlet程序中,在调用getWriter方法之前设置这些方法的值。
只要编写Servlet文件中含有响应给客户端的信息,那么就要写上这两句话。最好写上第二句话,因为它的优先级高,它的设置结果将覆盖setContentType等方法设置的字符编码集。
修改Tomcat的编码
在get请求所导致乱码问题中,还有一种解决的方案,我们常用Tomcat作为运行Servlet和JSP的容器,而Tomcat内部默认的编码是ISO-8859-1,所以对于get请求方式,其传递的数据(URI)会附加在访问的资源后面,其编码是Tomcat默认的,如果修改该URI的编码,那么对于所有的get请求方式便不会出现乱码了包括上边说的重定向和超链接,在Tomcat的配置文件server.xml中找到修改Tomcat的端口的地方,在其内部加入URIEncoding属性,设置为和你的项目中所设的编码一样的值,这里全部都是UTF-8。
在编写Servlet和JSP的时候,为了避免出现乱码,最重要的就是:采用一致的编码,如果编码都一致了,肯定不会出现乱码。