jsp tomcat7.0 网页post/get乱码 详细分析

本文分析了JSP页面提交表单时出现乱码的原因,并提供了具体的解决方案,涉及pageEncoding与contentType设置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

jsp的网页在提交表单时有乱码。本文详细分析了原因及解决办法。
需要提前知道简单的编码的知识。

1.jsp的pageEncoding和contentType属性


关于JSP页面中的pageEncoding和contentType两种属性的区别:

pageEncoding是jsp文件本身的编码

contentType的charset是指服务器发送给客户端时的内容编码

JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页, 用的是contentType。

第一阶段是jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。

第二阶段是由JAVAC的JAVA源码至java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。

JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。

第三阶段是Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效

contentType的设定.

pageEncoding 和contentType的预设都是 ISO8859-1.

jsp文件不像.java(直接写java本地程序产生),.java在被编译器读入的时候默认采用的是操作系统所设定的locale所对应的编码,比如中国大陆就是GBK,台湾就是BIG5或者MS950。而一般我们不管是在记事本还是在ue中写代码,如果没有经过特别转码的话,写出来的都是本地编码格式的内容。所以编译器采用的方法刚好可以让虚拟机得到正确的资料。

encodinga.jsp
<%@ page language="java" contentType="text/html; charset=utf-8"%>
<form action="encodingb.jsp">
name:<input type=text name=name>
<input type=submit value="中文">
</form>

encodingb.jsp
<%@ page language="java" contentType="text/html; charset=utf-8">
<%
String name=request.getParameter("name");
%>
<%=name %>
   
2.post过程。
浏览器上显示的页面的编码是utf-8,则用户输入到文本框中的文本的编码较复杂(应该由系统决定,跟locale一致)。post时,浏览器会将locale字符串转成ISO8859-1字符串送至tomcat服务器。这也是request.getParameter()得到的字符串。由encodingb.jsp产生的class处理这个字符串产生html页面,给浏览器显示。

 

 

Tomcat默认POST的编码方式为ISO-8859-1这种西文方式,而非需要的UTF-8,或者GB2312,GBK等。因此在POST传值的时候产生了乱码。

 

 

3解决方法

解决这个问题的方法有不少,较为简单,但非长久之策的一个方法如下:将类似于

String name=request.getParameter ( "name") ;

这样的语句改成

String name=new String ( ( request.getParameter ( "name" ) ) .getBytes ( "ISO-8859-1" ) ,"utf8" ) ;

即可。这里UTF-8可以换成其他合适的编码。

 

4附录(函数说明)

String.getBytes(String encoding);

将一个字符串以指定的字符集解码为字节序列。

String.String(byte [], String charsetName)

使用指定的字符集解码一个字节序列。

 

对于第一个函数来说,一个String是有其本身的编码的,给定了一个字符串,就给定了一块内存和以什么样的解码方式读取这块内存中的内容。getBytes则强致去掉了String原有的解码方式而以指定的encoding来解码这块内存。

 

 

 

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值