编码实验

本文详细介绍了UTF-8编码和Unicode编码的基本概念、转换方法及应用实例,包括二进制表示、合成数和十六进制表示,同时对比了ASCII、Unicode、Unicode big endian 和 UTF-8编码在不同文件格式下的表示形式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、UTF-8编码实验

二进表示
100111000100101
按UTF-8格式,6位分组拆分
     100   111000   100101
UTF-8编码                                         合成一个数                                       16进制表示
11100100 10111000 10100101  111001001011100010100101    E4B8A5


二进表示
110100000111100
按UTF-8格式,6位分组拆分
     110   100000   111100
UTF-8编码                                         合成一个数                                       16进制表示
11100110 10100000 10111100  111001101010000010111100    E6A0BC

在文件中,前三个字节“EF BB BF”表示这是UTF-8编码
如“严格”在UTF-8格式文件中表示为:
EF BB BF E4 B8 A5 E6 A0 BC

2、Unicode

其中“FF FE”表明是小头方式存储


3、Unicode big endian

其中“FE FF”表明是大头方式存储

4、“严”

1)在ASCII格式文件中:

D1 CF

2)在Unicode 格式文件中,FF EE是格式说明前缀

FF FE 25 4E

3)在Unicode big endian格式文件中,FE FF是格式说明前缀

FE FF 4E 25

4)在UTF-8格式文件中,EE BB BF是格式说明前缀

EF BB BF E4 B8 A5


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值