汉字编码国家标准以及GB18030

博客介绍了汉字编码国家标准,如GB 2312、GBK、GB13000.1、GB 18030等,指出GB 18030是替代标准。阐述了各标准间关系,介绍GB 18030的双字节和四字节部分,提及支持该标准的OS,还指出其在Windows平台使用中因4字节编码存在问题。

 

汉字编码国家标准及现状

1.名称:

    GB 2312-1980(信息交换用汉字编码字符集 基本集)

    GBK-1995(汉字内码扩展规范)

    GB13000.1-1993(信息技术 通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面(idt ISO/IEC 10646.1-1993))

    GB 18030-2000(信息交换用汉字编码字符集 基本集的扩充)

 

2.关系:

    GB 18030完全兼容GBK、GB2312,并且是后二者的替代标准,也将是今后唯一的字符集国家标准。

    GB 18030和GB13000.1的关系:在字汇上兼容,码表则不兼容。例如,两个标准中都会有字,但两个标准中,的内码是不同的。

    GB13000.1和ISO10646为同一体系,与工业标准Unicode3.1是兼容的。

 

3.GB18030:

    该标准分为两个部分:双字节部分和四字节部分。

    双字节部分和GBK基本完全相同。

    四字节部分到目前为止,比GBK多了6582个汉字(27484-20902),0x8139ef30~0x82358738。对应GB13000.1则为0x3400~0x4db5。

 

4.目前支持该标准的OS:

    2001年9月1日后的Windows2000 的补丁版;

    Windows XP;

    以及一些Linux、Unix的OS。

5.GB18030的问题
    由于GB18030中包括了4字节编码汉字,和目前Windows平台中普遍使用的2字节编码的GBK和Unicode3.1有较大区别,因此在使用中出现了很多问题。例如微软的Windows XP中实际上只支持Unicode3.1编码,并不支持GB18030的4字节编码汉字。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值