【计算机】(UTF-8)字符集进化史

本文讲述了字符集的发展历史,从ASCII码到Unicode编码,再到UTF-16和UTF-8编码的演变过程。揭示了字符集如何解决不同国家和地区文字编码不一致的问题,以及为何UTF-8成为最终的解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

对字符集的理解一直就是不管三七二十一,选择UTF-8就对了,今天在一个Mysql教学视频里了解到了字符集,感觉如醍醐灌顶,受益匪浅

一:由来

各大计算机运营商、各国、标准化组织等对自己感兴趣的文字进行编码,以便计算机程序能够识别

二:ASCII码

第一个字符集,美国标准化组织发布的,主要是为了解决美国的文字符号及其编码

三:Unicode编码

为了解决各大运营商、各国字符集不一致,对软件的开发移植造成的影响,ISO发布

四:UTF-16编码

Unicode编码占用4个字节,不被一些公司接受,一些公司联合发布Unicode1.0,占用2个字节,ISO与Unicode1.0协商统一发布BMP编码,考虑到新的字符(不在BMP中)时怎么办?提出UTF-16编码

五:UTF-8编码

当时的计算机世界最流行的还是ASCII编码(单字节),UTF-16依赖于Unicode环境,故为了兼容,提出UTF-8编码解决方案:将ASCII码转成单字节编码,2、3、4字节用以转换Unicode编码。UTF-8兼容所有,是最终解决方案

总结:一部字符集的血泪史,兼容、兼容、兼容...,没有最完美的解决方案,只有当时最合适、最优的解决办法

参考:https://ke.qq.com/webcourse/index.html#cid=311666&term_id=100369504&taid=2319595872764274&type=1024&vid=w1426ktjcv6

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值