问题代码
byte[] bytes = new byte[]{40, -37, -96, 46, -75, -10};
byte[] myBytes = new String(bytes).getBytes();
System.out.println(Arrays.toString(bytes));
System.out.println(Arrays.toString(myBytes));
输出结果
问题原因
new String(byte[])和getBytes()默认使用的编码都是通过这条语句获取的编码
String csn = Charset.defaultCharset().name();
而我当前环境的编码为UTF-8
所以在我的环境下,下面两句代码实际上是等效的
byte[] bytes1 = new String(bytes).getBytes();
byte[] bytes2 = new String(bytes, CharEncoding.UTF_8).getBytes(CharEncoding.UTF_8);
解决原理
由于UTF-8是多字节编码,需要用多个字节来表示一个字符的编码,所以也就出现了在转换之后byte[]数组长度、内容不一致的情况。
而ISO-8859-1编码是单字节编码,所以使用该编码就不会出现上面的问题
byte[] bytes3 = new String(bytes, CharEncoding.ISO_8859_1).getBytes(CharEncoding.ISO_8859_1);
版权声明:本文为博主学习笔记,如果你觉得写的还不错可以“推荐”一下哦,感谢~ https://blog.youkuaiyun.com/qq_27760433/article/details/78327328