非数值类型数据表示

本文深入探讨了字符编码的基本概念,重点介绍了ASCII码的结构和应用,以及汉字编码的国家标准GB2312-1980和GB18030。详细解释了区位码、国标码和汉字内码的转换过程,为理解中西文字符编码提供了全面的视角。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

字符编码ASCII码

目前,国际上普遍采用的一种字符系统是7位二进制编码的ASCII码。
在ASCII码中,编码值0~31为控制字符,用于通信控制或设备的功能控制,编码127是DEL码,编码值32是空格sp,编码值32-126共95个字符为可印刷字符。48-57为0-9的ASCII码,取掉ASCII码48-57的二进制形式的前三位,剩下的恰好是0-9的二进制表示。

汉字的表示和编码

在1981年的国家标准GB2312-1980中,每个编码用两个字节表示,共收录了汉字和符号7445个字。

最新的汉字国家标准是GB18030,共收录了27484个汉字。

汉字的编码包括汉字的输入编码,汉字内码,汉字字形码三种。他们是用于输入,内部处理,输出三种用途的编码。

区位码:
区位码是国家标准局与1981年颁布的国家标准,它用两个字节表示一个汉字,每个字节用七位,并将汉字和图形符号排列在一个94行94列的二位代码表中。区位码是四位十进制数,前两位是区码,后两位是位码。

国标码:
将十进制的区位码转换为十六进制之后,再在每个字节上加上20H,这就是国标码

汉字内码:
国标码两个字节的最高位都是0,ASCII码最高位也是0,为了与ASCII码相区分,将国标码两个字节的最高位改为1,这就是汉字内码

国标码=区位码(16)+2020H
汉字内码=国标码(16)+8080H

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值