Unicode和UTF-8区别

最新推荐文章于 2023-11-16 14:47:41 发布

原创最新推荐文章于 2023-11-16 14:47:41 发布 · 336 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#unicode #utf-8

其他专栏收录该内容

1 篇文章

订阅专栏

本文深入探讨了ASCII码和Unicode编码的基本概念，解释了ASCII码的奇偶校验原理及Unicode编码的全球字符覆盖特性。此外，还对比了Unicode与UTF-8编码的区别，阐述了UTF-8的变长字节表示机制。

ASCII码

一个ASCII码值占一个字节(8个二进制位)，其最高位(b7)用作[奇偶校验位]

奇校验规定：正确的代码一个字节中1的个数必须是奇数，若非奇数，则在最高位b7添1；

偶校验规定：正确的代码一个字节中1的个数必须是偶数，若非偶数，则在最高位b7添1。

备注：48=‘0’ 65=‘A’ 97=‘a’

Unicode码：它前128个字符就是ASCII码，之后是扩展码

`Unicode`和`UTF-8`区别

Unicode为世界上所有字符都分配了一个唯一的数字编号，这个编号范围从 0x000000 到 0x10FFFF(十六进制)，有110多万，每个字符都有一个唯一的Unicode编号，这个编号一般写成16进制，在前面加上U+。例如：“马”的Unicode是U+9A6C。

它是一种规定，Unicode本身只规定了每个字符的数字编号是多少，并没有规定这个编号如何存储（占几个字节存储，计算机中每八个二进制位组成了一个字节（Byte），计算机存储的最小单位就是字节），除了这种直接转换成二进制的方案外，还有其他方案，主要有UTF-8，UTF-16，UTF-32

UTF-8就是使用变长字节表示,顾名思义，就是使用的字节数可变，这个变化是根据 Unicode 编号的大小有关，编号小的使用的字节就少，编号大的使用的字节就多。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。