英文属于单子节编码, 汉字属于多字节编码,国际标准多字结为UNICODE编码,标准之中定义了世界上大部分国家的代码页,一般代码为双字节,第一字节为前导字节表明语种,第二字节为代码页中对应的字符.
我国用的是自己定义的GB码,有些是双字节,有些是多字节,于UNICODE很不一样,
其实光凭HEX值,是可以显示任何代码页中的字符的,关键是要和代码页对应上,两个Hex值就可以显示一个汉字.
英文中每一个字符值(大小写)必小于128, 如果你的CString只有两种情况(全英文或全汉字)判断起来比较容易,汉字编码的第一个字节的最高位为1(>128无论是几个字节编码),若是英汉混合的情况,要检出其中一种,稍微麻烦一点,若要处理多国语言,好像有多国语言API函数,可以通过统计的方法检出一直对应的代码页.
我以前涉及过多国语言字符的检索和显示的问题,但没有做得很深!
Hawk_lp撰写
汉字在计算机中的表示
最新推荐文章于 2024-07-21 10:45:38 发布