1. 概念
1.1 编码:字符串转化为字节数组byte[]
编码是指机器能看懂的代码,即二进制0和1,离二进制最近的就是byte类型
1.2 解码:字节数组byte[]转化为字符串
解码把我们看不懂的byte按照指定的字符集进行解密,生成我们看得懂的字符串
2. 演示
2.1 编码
@Test
public void test4() throws UnsupportedEncodingException {
// 编码: 字符串 转化为 字节数组byte[]
// 对字符串以GBK进行编码
byte[] b_gbk = "吴".getBytes("GBK");
System.out.println("GBK长度:" + b_gbk.length); // 2
// 对字符串以UTF-8进行编码
byte[] b_utf8 = "吴".getBytes("UTF-8");
System.out.println("UTF-8长度:" + b_utf8.length); // 3
// 对字符串以ISO8859-1进行编码
byte[] b_iso88591 = "吴".getBytes("ISO8859-1");
System.out.println("ISO8859-1长度:" + b_iso88591.length); // 1
}
2.2 解码
// 解码: 字节数组byte[] 转化为 字符串
// 对b_gbk进行解码
String s_gbk = new String(b_gbk, "GBK");
// 对b_utf8进行解码
String s_utf8 = new String(b_utf8, "UTF-8");
// 对b_iso88591进行解码
String s_iso88591 = new String(b_iso88591, "ISO8859-1");
2.3 输出结果
System.out.println(s_gbk); // 吴
System.out.println(s_utf8); // 吴
System.out.println(s_iso88591); // ? 因为ISO8859-1编码的编码表中没有包含汉字字符
3.其它
3.1 UTF-8编码->ISO8859-1解码 得不到正确字符
// 将"中"以UTF-8编码,再以ISO8859-1解码
String i_iso88591 = new String("中".getBytes("UTF-8"), "ISO8859-1");
System.out.println(i_iso88591);
3.2 UTF-8编码->ISO8859-1解码->ISO8859-1编码->UTF-8解码 得到正确字符
// 1.UTF-8编码->ISO8859-1解码->ISO8859-1编码->UTF-8解码 得到正确字符
// 1.1 将"中"以UTF-8编码,再以ISO8859-1解码
String i_iso88591 = new String("中".getBytes("UTF-8"), "ISO8859-1");
// 1.2 将"i_iso88591"以ISO8859-1编码,再以UTF-8解码
String s = new String(i_iso88591.getBytes("ISO8859-1"), "UTF-8");
System.out.println(s);
3.3 ISO-8859-1场景
场景1
许多浏览器在Content-Type头中不会指定字符编码方式,那么容器就会使用"ISO-8859-1"方式解析POST数据,而此时,为了向开发人员提示字符编码方式未指定,容器将会在getCharacterEncoding返回null.
如果客户机没有设置字符编码信息,但是request数据又以和缺省编码方式不同的方式编码,就会发生数据破坏。setCharacterEncoding(String enc)方法可以防止这种状况发生,但是必须在解析数据或从request中读取数据之前调用。否则调用该方法不会有任何效果。
场景2
http header头要求其内容必须为ISO8859-1编码
// 进行字符转换
String reqCharset = httpServletRequest.getCharacterEncoding();
reqCharset = reqCharset == null ? "UTF-8" : reqCharset;
// http header头要求其内容必须为ISO8859-1编码
fileName = new String(fileName.getBytes(reqCharset), "ISO8859-1");
// 设置下面文件名
// Content-Disposition为属性名disposition-type是以什么方式下载
httpServletResponse.setHeader("Content-disposition", "attachment;filename=" + fileName);