计算机-编码问题

计算机编码介绍

原文链接:https://blog.youkuaiyun.com/qq_26927285/article/details/52713856

什么是计算机编码*

在计算机中,所有的数据在存储和运算时都要使用二进制数表示,例如,a-z、A-Z、0-9数字以及还有一些常用的符号(例如*、#、@等)
在计算机中存储时也要使用二进制数来表示,而具体用哪些二进制数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码),
而大家如果要想互相通信而不造成混乱,那么大家就必须使用相同的编码规则,于是美国有关的标准化组织就出台了所谓的ASCII编码,
统一规定了上述常用符号用哪些二进制数来表示。

ASCII编码

ASCII码于1961年提出,用于在不同计算机硬件和软件系统中实现数据传输标准化。

ASCII是美国国家信息交换标准代码,一种使用7位或8位二进制位进行编码的方案,最多可以给256个字符(包括字母、数字、标点符号、控制符号及其他符号)分配或指定数值。

ASCII码划分为两个集合:基本ASCII码和扩展ASCII码。基本ASCII码使用7位二进制表示一个字符,共128个字符;扩展ASCII码使用8位,256个字符。

ANSI编码

为了扩充ASCII编码,以用于显示本国的语言,不同的国家和地区制定了不同的标准,由此产生了GB2312、BIG5、JIS等各自的编码标准。
这些使用2个字节来代表一个字符的各种延伸编码方式,称为ANSI编码,又称MBCS(多字节字符集)。
在简体中文系统下,ANSI编码代表GB2312编码,在日文操作系统下,ANSI编码代表JIS编码。不同ANSI编码之间互不兼容,这样容易造成混乱。

GB2312编码

GB2312是ANSI编码里的一种,为了满足国内计算机中使用汉字的需要。中国国家标准总局发布了一系列的汉字字符集国家标准编码,统称为GB码,或叫国标码。
其中最有影响的是于1980年发布的《信息交换用汉字编码字符集基本集》,标准号为GB2312-80。
GB2312是一个简体中文字符集,由6763个常用汉字和682个全角字符组成。一级汉字3755个,二级汉字3008个。
GB2312编码用两个字节表示一个汉字,所以理论上最多可以表示256*256=65536个汉字。

GBK编码

GB2312的出现,基本满足了汉字的计算机处理需要,但对于人名、古汉语等方面出现的罕见字,GB2312不能处理,这导致了GBK的出现。

GBK即汉字内码扩展规范,K为扩展的意思。GBK编码标准兼容GB2312,采用双字节表示,共计23940个码位,共收录21886个汉字和图形符号,并提供1894个造字码位。

BIG编码

在台湾、香港与澳门地区,使用的是繁体中文字符集。而1980年发布的GB2312简体中文字符集,并不支持繁体汉字。
在使用繁体中文的地区,出现了很多厂商提出的字符集编码,这些编码彼此互不兼容。为了统一繁体字符集编码,
1984年,台湾五大厂商宏基、神通、佳佳、零壹和大众共同制定了一种繁体中文编码方案,称为大五码,英文写作Big5

Unicode编码

世界上存在着多种编码方式,在ANSi编码下,同一个编码值,在不同的编码体系里代表着不同的字。
在简体中文操作系统下,ANSI编码代表GB2312编码,在日文操作系统下,ANSI编码代表JIS编码,可能显示中文,也可能显示英文。
在ANSI编码体系下,要想打开一个文本文件,不但要知道它的编码方式,还要安装有对应编码表,否则就无法读取或出现乱码。
为什么电子邮件和网页都经常出现乱码,就是因为信息的提供者与读取者使用的ANSI编码体系不同,导致乱码。这个问题促使了unicode码的诞生。

如果有一种编码,将世界上所有符号都纳入其中,无论是中文、英文,还是日文,大家都使用这个编码表,就不会出现编码不匹配现象,乱码问题也就不存在了。这就是Unicode编码。

Unicode是一个很大的集合,现在的规模可以容纳100多万个字符。Unicode虽然统一编码方式,但它的效率不高。Unicode标准之一规定用4个字节存储一个符号,
但英文1个字英就满足了,其它的三个字节都是0,这对存储和传输来说都很耗资源。

UTF-8编码

为了提高Unicode编码效率,于是就出现了UTF-8编码。UTF-8可以根据不同的符号自动选择编码的长短。比如英文字母可以只用1个字节就够了,汉字使用2个字节就够了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值