1、一字节byte=8比特bit,so,一字节能表示的最大的整数就是255(二进制:1111 1111)
2、最早ASCII编码,用一个字节byte来表示127个字符,包括:大小写英文字母,数字,一些符号
3、中国GB2312编码:加入中文的编码。与此同时,各国有对应编码。多国语言就会导致乱码
4、Unicode编码:把所有语言都统一到一套编码里,常用两个字节表示一个字符。
5、UTF-8编码:可变长编码,根据字符选用1-6字节,英文通常1字节,汉字通常3字节,从而节省空间和加快传输
6、计算机系统通用的字符编码工作方式:计算机内存中统一使用Unicode编码,当需要保存到硬盘或需要传输时,转换为UTF-8编码。
从ASCII到Unicode,再到UTF-8,编码技术如何逐步演进以适应全球化的多语言需求。本文详细解析了字节与比特的关系,ASCII编码的局限,GB2312等国家编码的出现,以及最终统一标准——Unicode和其高效实现形式UTF-8的诞生。
2万+

被折叠的 条评论
为什么被折叠?



