编码和字符集的关系

编码是一种方案,一种编码对应着自己固有能表示的字符集。

例如最原始的ascii编码,就只能表示127个字符,后来扩展到255个字符~~

GB2312编码,又对应着几千个中文和其他符号的字符集。

GB2312可以理解为一种字符集(有人叫“编码字符集”),也可以理解为一种编码的方案(有人叫“字符集编码”)。

理解为字符集,就表示GB2312固有对应的几千个字符。

理解为编码的方案,就表示如何把一个汉字对应到二进制上(即字节上),例如GB2312用两个字节表示一个汉字,而UTF8用三个字节表示一个汉字。

这个文章可以参考以下:http://www.cnblogs.com/anran_guojianjun/archive/2008/12/27/1363465.html

 

另外需要注意的是Unicode编码,有点特殊,每个字符规定用2个字节存储~~跟ASCII有点对立的味道,哈哈~~

 

另外有一篇文章,写得挺风趣幽默的,说了编码发展的历史。虽然长,但看完之后应该有很深刻的理解。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值