GB2312为什么要从0xA1A1开始呢?
因为要区别其它编码, 比如ascii, 所以gb2312不能直接区位来编码, 而是要跳过160(0xa0)开始.
GB2312编码是从区位: A1A1开始的.
减0XA0就是对应的区码和位码.
区码是从1开始算起
位码也是从1开始算起
以汉字"我"为例
"我"的GB2312码为: 0xCED2
从文件读出来的先后顺序:0xCE 0xD2(以大端存储).
"我"的区位码为:
区码为: 46(10进制), 表示在第46区
位码为: 50(10进制), 表示在第46区的第50位
计算过程:(只要减去0xA0(160)就可以了)
0xCE - 0xA0 = 0x2E => 46(10进制)
0xD2 - 0xA0 = 0x32 => 50(10进制)
GB2312编码从0xA1A1开始的原因
GB2312编码为了避免与ASCII等其他编码冲突,从0xA1A1开始,跳过160(0xA0)。我的GB2312码是0xCED2,对应区码46和位码50,通过减去0xA0得到区位码的10进制表示。这种编码方式有助于区分不同的字符集。
5071

被折叠的 条评论
为什么被折叠?



