在基于J2EE的B/S应用中,中文乱码是一个永恒的主题,永远都无法回避。诚然对于一般的程序员,我们没有必要对编码进行深刻的研究。但是至少我们需要了解:
①编码基础
②String的getBytes([encoding])方法内幕
③String的toCharArray()方法内幕
④输出时的编码与乱码原因
⑤UTF-8的编码规则和GBK如何转换到UTF-8
⑥字符在各种表现形式下的值
⑦native2ascii命令的用法
正因为Java中采用了Unicode编码作为中介,所以任何初始的输入和最终的输出都会有:
①从byte[]----》encode字符---》Unicode的输入转换
②从Unicode---》encode字符---》byte[]的输出转换
一个典型的J2EE B/S应用,从客户端输出到最终服务器端的输出,需要经历如下的流程
详情见附件