Unicode、GBK、UTF-8

本文介绍了Unicode、GBK和UTF-8三种字符编码方式。Unicode是扩展ASCII的双字节编码,所有字符16位,GBK专为中文编码设计,UTF-8则是变长编码,根据符号不同占用1~4个字节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Unicode

  Unicode是ASCII字符编码的一个扩展,只不过在Windows中用2个字节对其编码,因此也被称为宽字符集(Widechars)。

  Unicode是一种双字节编码机制的的字符集,使用0~65535的双字节无符号整数对每个字符进行编码。在Unicode中,所有的字符都是16位的,其中所有的7位ASCII码都被扩充为16位(高位扩充零)。

GBK

  GBK编码专门用来解决中文编码,是双字节的。不论中英文都是双字节的。

UTF-8

  UTF-8不是固定字长编码,而是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值