ASCII码
一个ASCII码值占一个字节(8个二进制位),其最高位(b7)用作[奇偶校验位]
奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;
偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。
备注:48=‘0’ 65=‘A’ 97=‘a’
Unicode码:它前128个字符就是ASCII码,之后是扩展码
Unicode和UTF-8区别
Unicode为世界上所有字符都分配了一个唯一的数字编号,这个编号范围从 0x000000 到 0x10FFFF(十六进制),有110多万,每个字符都有一个唯一的Unicode编号,这个编号一般写成16进制,在前面加上U+。例如:“马”的Unicode是U+9A6C。
它是一种规定,Unicode本身只规定了每个字符的数字编号是多少,并没有规定这个编号如何存储(占几个字节存储,计算机中每八个二进制位组成了一个字节(Byte),计算机存储的最小单位就是字节),除了这种直接转换成二进制的方案外,还有其他方案,主要有UTF-8,UTF-16,UTF-32
UTF-8就是使用变长字节表示,顾名思义,就是使用的字节数可变,这个变化是根据 Unicode 编号的大小有关,编号小的使用的字节就少,编号大的使用的字节就多。
ASCII与Unicode编码解析
本文深入探讨了ASCII码和Unicode编码的基本概念,解释了ASCII码的奇偶校验原理及Unicode编码的全球字符覆盖特性。此外,还对比了Unicode与UTF-8编码的区别,阐述了UTF-8的变长字节表示机制。
280

被折叠的 条评论
为什么被折叠?



