【Tomcat】关于JAVA中文乱码的一些看法
长话短说,直接说说Java,尤其是Tomcat对于编码解码的一点了解。
1.get提交
对于直接URI请求和表单的get提交,都是把数据串联在URL后面作为参数。而Tomcat对此的态度是:首先获取Connector的解码集进行解码,该配置在server.xml:<Connector URIEncoding="utf-8" useBodyEncodingForURI="true"/>。如果没有定义则会采用默认编码ISO-8859-1来解析。
对于直接URI请求和表单的get提交,都是把数据串联在URL后面作为参数。而Tomcat对此的态度是:首先获取Connector的解码集进行解码,该配置在server.xml:<Connector URIEncoding="utf-8" useBodyEncodingForURI="true"/>。如果没有定义则会采用默认编码ISO-8859-1来解析。
大部分浏览器在没有指定页面编码的情况下(如<meta
http-equiv="Content-Type" content="text/html; charset=GBK"/>),都是使用UTF-8或GBK进行编码,而server.xml配置大部分同学也都没有进行配置,故默认都是用ISO-8859-1来解码。因此get请求出现乱码频率很高。
代码解决方式:new String(request.getParameter("name").getBytes("iso-8859-1″),"utf-8") 的形式来获取正确数据。
2.post提交
对于Tomcat而言:默认使用页面编码方式的ContentType中设置的字符集来进行解码,如没有指定,则默认使用iso-8859-1进行解码。
2.post提交
对于Tomcat而言:默认使用页面编码方式的ContentType中设置的字符集来进行解码,如没有指定,则默认使用iso-8859-1进行解码。
代码解决方式:request.setCharacterEncoding("utf-8")可以指定解码方式。