GBK特点:
1.中文字由两个字节表示
2.两个字节为负数
UTF-8特点:
1.UTF用一到三个字节表示
2.表示的字节都为负数
2.UTF每个字节都有标识,如果一个字节表示一个字符,该字节的最高位为0,例:01101101
如果两个字节表示一个字符,第一个字节最高位和次高位都为1,第二个字节的最高位为1,次高位为0。例:1100010010010101
如果三个字节表示一个字符,第一个字节前三位都为1,第四位为0;第二个字节的前两位为1,第三位为0;第三个字节的前一个位为1,第二位为0
例:1110101011010101 10101010
加密与解密
加密:将字符串变成字符数组
String----->byte[] 用getByte()方法,此方法可以加编码集getBytes(Charset charset)
解密:将字符数组变成字符串
byte[]------>String 用new String(byte[])方法,同样的,此方法也可以加编码集String(byte[] bytes,Charset charset)
下面是一个关于加密与解密的示例:
import java.util.*;
import java.io.*;
class EncodeDemo
{
public static void main(String[] args) throws UnsupportedEncodingException
{
//加密
byte[] str="联通".getBytes("UTF-8");
//打印字节编码
System.out.println(Arrays.toString(str));
//解密
String s=new String(str,"UTF-8");
System.out.println(s);
}
}
本文详细介绍了GBK和UTF-8编码的特点,包括中文字的表示方式和字节范围,并提供了加密与解密的示例代码。
1144

被折叠的 条评论
为什么被折叠?



