String s="慕课ABC";
byte[] bytes1=s.getBytes();
//这是把字符串转换成字符数组,转换成的字节序列用的是项目默认的编码
for(byte b: bytes1)
System.out.println(Integer.toHexString(b & 0xff)+" ");//& 0xff是为了把前面的24个0去掉只留下后八位
//toHexString这个函数是把字节(转换成了Int)以16进制的方式显示
byte[] bytes1=s.getBytes("gbk");//也可以转换成指定的编码
- gbk编码: 中文占用两个字节,英文占用一个字节
- utf-8编码:中文占用三个字节,英文占用一个字节
- java是双字节编码,是utf-16be编码
- utf-16be编码:中文占用两个字节,英文占用两个字节
当你的字节序列是某种编码时,这个时候想把字节序列变成字符串,也需要用这种编码方式,否则会出现乱码
String str1=new String(bytes4);//这时会使用项目默认的编码来转换,可能出现乱码 要使用字节序列的编码来进行转换
String str2=new String(bytes4,"utf-16be");
文本文件就是字节序列,可以是任意编码的字节序列
如果我们在中文机器上直接创建文本文件,那么该文件只认识ANSI编码(例如直接在电脑中创建文本文件)