字符编码:Unicode和UTF-8

本文深入探讨了Unicode字符集及其编码方式,解释了Unicode作为符号编码标准的重要性,以及UTF-8作为Unicode的一种高效实现方式,如何使用1到4个字节表示不同符号。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Unicode,就像它的名字都表示的,这是一种所有符号的编码。

Unicode只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。

Unicode自身的定义的表达方式非常浪费空间。

具体编码对应查询 http://www.unicode.org/ , http://www.chi2ko.com/tool/CJK.htm


 

 

UTF-8是Unicode的实现方式之一

是一种变长的编码方式。它可以使用1~4个字节表示一个符号


 

 

参考阅读:

字符编码笔记:ASCII,Unicode和UTF-8 :http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

 

转载于:https://www.cnblogs.com/pudding-ai/p/4544065.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值