1.编码:由字符转换为字节。
2.解码:由字节转换为字符。
3.编码方式:
ASCII:用来表示英文字符的一种编码规范,每个ASCII字符占用1个字节(8bits)。
GB2312: 简体中文,GB 2312 对任意一个图形字符都采用两个字节表示,
并对所收汉字进行了“分区”处理,每区含有 94 个汉字/符号,
分别对应第一字节和第二字节。这种表示方式也称为区位码。
GBK:可以存储中文,一个汉字两个字节,一个英文占一个字节。
GB18030: ① GB 2312-1980 和 GBK 兼容,共收录汉字70244个。
② GB 18030 编码是一二四字节变长编码。
③ 与 UTF-8 相同,采用多字节编码,每个字可以由 1 个、2 个或 4 个字节组成。
unicode: Unicode有两套标准,一套叫UCS-2(Unicode-16),用2个字节为字符编码,另一套叫UCS-4(Unicode-32),用4个字节为字符编码。
2.解码:由字节转换为字符。
3.编码方式:
ASCII:用来表示英文字符的一种编码规范,每个ASCII字符占用1个字节(8bits)。
GB2312: 简体中文,GB 2312 对任意一个图形字符都采用两个字节表示,
并对所收汉字进行了“分区”处理,每区含有 94 个汉字/符号,
分别对应第一字节和第二字节。这种表示方式也称为区位码。
GBK:可以存储中文,一个汉字两个字节,一个英文占一个字节。
GB18030: ① GB 2312-1980 和 GBK 兼容,共收录汉字70244个。
② GB 18030 编码是一二四字节变长编码。
③ 与 UTF-8 相同,采用多字节编码,每个字可以由 1 个、2 个或 4 个字节组成。
unicode: Unicode有两套标准,一套叫UCS-2(Unicode-16),用2个字节为字符编码,另一套叫UCS-4(Unicode-32),用4个字节为字符编码。
ANSI: 系统预设的标准文字储存格式。就是本地操作系统的编码格式。
UTF-8:一个英文占1个字节,一个汉字占3个字节。