计算机基础:5、计算机的字符与编码集

从ASCII码到Unicode,字符编码经历了多次革新。ASCII码最初仅能表示95个可打印字符和33个不可打印字符,随后的Extended ASCII码虽有所扩充,但仍无法满足全球化需求。GB2312和GBK编码解决了中文字符的表示问题,但Unicode编码最终实现了全球字符的统一编码,通过UTF-8等编码方式实现全球语言的兼容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ASCII码

使用7个bits就可以完全表示ASCII码,包含95个可打印字符,33个不可打印字符
ASCII码因为很多应用或者国家中的符号都无法表示(数学的乘除、大于等于等符号),因此后续对ASCII码进行了扩充,扩充的编码称为extended ascii码

Extend ASCII码

在ASCII码的基础上的拓展,但是还是无法表示全部国家的编码

字符编码集的国际化

因为欧洲、中亚、东亚、拉丁美洲国家的语言多样性
语言体系不一样,不以有限字符组合的语言(如中文、韩文、日文)等问题,因此编码开始国际化

中文编码集

GB2312

1980年发明的,称为《信息交换用汉字编码字符集–基本集》
GB2312一共收录了7445个字符包括6763个汉字和682个其他字符
但是GB2312不符合国际标准

GBK

因GB2312不符合国际标准,所以1995年推出了GBK编码
GBK称为《汉字内码扩展规范》,向下兼容GB2312,向上支持国际ISO标准
收录了21003个汉字,支持全部中日韩汉字,但是还是存在无法兼容外国内容的问题

Unicode

unicode称为统一码,万国码,单一码,兼容全球的字符集,兼容全世界所有的语言

unicode定义了世界通用的字符集,使用UTF-*实现了编码

UTF-8以字节为单位对unicode进行编码

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值