常见字符集:
ASCII:美国信息交换标准代码。一个字节表示。
GBK:汉字编码字符集。两个字节表示。
按照这样下去,那每个国家都要有自己的字符集,太麻烦了。
所以Unicode字符集应运而生。
Unicode:
万国码:容纳世界上所有文字、符号的字符集。
UTF-32:四个字节表示。
UTF-8:采取可变长编码方案,共分四个长度区:1个字节、2个字节、3个字节、4个字节。
英文占用一个字节,汉字占用三个字节。
通过前置固定编码来分辨:
对字符的编码:
对字符的解码:
常见字符集:
ASCII:美国信息交换标准代码。一个字节表示。
GBK:汉字编码字符集。两个字节表示。
按照这样下去,那每个国家都要有自己的字符集,太麻烦了。
所以Unicode字符集应运而生。
Unicode:
万国码:容纳世界上所有文字、符号的字符集。
UTF-32:四个字节表示。
UTF-8:采取可变长编码方案,共分四个长度区:1个字节、2个字节、3个字节、4个字节。
英文占用一个字节,汉字占用三个字节。
通过前置固定编码来分辨:
对字符的编码:
对字符的解码: