【基础】 ---- 字符串中的编码解码问题

1. 概念

1.1 编码:字符串转化为字节数组byte[]
 编码是指机器能看懂的代码,即二进制0和1,离二进制最近的就是byte类型

1.2 解码:字节数组byte[]转化为字符串
 解码把我们看不懂的byte按照指定的字符集进行解密,生成我们看得懂的字符串

2. 演示

2.1 编码

@Test
    public void test4() throws UnsupportedEncodingException {

        // 编码: 字符串 转化为 字节数组byte[]
        // 对字符串以GBK进行编码
        byte[] b_gbk = "吴".getBytes("GBK");
        System.out.println("GBK长度:" + b_gbk.length); // 2 

        // 对字符串以UTF-8进行编码
        byte[] b_utf8 = "吴".getBytes("UTF-8");
        System.out.println("UTF-8长度:" + b_utf8.length); // 3 

        // 对字符串以ISO8859-1进行编码
        byte[] b_iso88591 = "吴".getBytes("ISO8859-1");
        System.out.println("ISO8859-1长度:" + b_iso88591.length); // 1
    }

2.2 解码

 // 解码: 字节数组byte[] 转化为 字符串
        // 对b_gbk进行解码
        String s_gbk = new String(b_gbk, "GBK");

        // 对b_utf8进行解码
        String s_utf8 = new String(b_utf8, "UTF-8");

        // 对b_iso88591进行解码
        String s_iso88591 = new String(b_iso88591, "ISO8859-1");

2.3 输出结果

System.out.println(s_gbk); // 吴
        System.out.println(s_utf8); // 吴
        System.out.println(s_iso88591); // ?  因为ISO8859-1编码的编码表中没有包含汉字字符

在这里插入图片描述

3.其它

3.1 UTF-8编码->ISO8859-1解码 得不到正确字符

// 将"中"以UTF-8编码,再以ISO8859-1解码
        String i_iso88591 = new String("中".getBytes("UTF-8"), "ISO8859-1");
        System.out.println(i_iso88591);

3.2 UTF-8编码->ISO8859-1解码->ISO8859-1编码->UTF-8解码 得到正确字符

// 1.UTF-8编码->ISO8859-1解码->ISO8859-1编码->UTF-8解码 得到正确字符

        // 1.1 将"中"以UTF-8编码,再以ISO8859-1解码
        String i_iso88591 = new String("中".getBytes("UTF-8"), "ISO8859-1");
        // 1.2 将"i_iso88591"以ISO8859-1编码,再以UTF-8解码
        String s = new String(i_iso88591.getBytes("ISO8859-1"), "UTF-8");
        System.out.println(s);

3.3 ISO-8859-1场景

场景1
许多浏览器在Content-Type头中不会指定字符编码方式,那么容器就会使用"ISO-8859-1"方式解析POST数据,而此时,为了向开发人员提示字符编码方式未指定,容器将会在getCharacterEncoding返回null.

如果客户机没有设置字符编码信息,但是request数据又以和缺省编码方式不同的方式编码,就会发生数据破坏。setCharacterEncoding(String enc)方法可以防止这种状况发生,但是必须在解析数据或从request中读取数据之前调用。否则调用该方法不会有任何效果。

场景2
http header头要求其内容必须为ISO8859-1编码

// 进行字符转换
String reqCharset = httpServletRequest.getCharacterEncoding();
reqCharset = reqCharset == null ? "UTF-8" : reqCharset;
// http header头要求其内容必须为ISO8859-1编码
fileName = new String(fileName.getBytes(reqCharset), "ISO8859-1");
// 设置下面文件名
// Content-Disposition为属性名disposition-type是以什么方式下载
httpServletResponse.setHeader("Content-disposition", "attachment;filename=" + fileName);
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值