一直对于编码的问题非常的模糊,特写一文以备回顾。
参考资料:http://www.nengcha.com/code/unicode/class/ (unicode码表)
概念:
CJK:中日韩统一表意文字(CJK Unified Ideographs),在码表的码区是:0x4300-0x9FBF。
全角字符:占两个标准字符(两个字节)的字符,主要是中日韩象形文字和特殊字符,及全角数字,英文字符和符号。
全角数字、英文、符号例子:
1234567890
abcdefghijklmnopqrstuvwsyz
ABCDEFGHIJKLMNOPQRSTUVWSYZ
,。、~!@#¥%…&+|{}?》《。,。=-
半角数字、英文、符号例子:
1234
abcd
,><,
因为半角只占一个标准字符的,为了与全角对齐,所以出现了全角的数字、英文、符号,可以从下面的例子看出:
我是中文字符
abcdef
是不是非常的工整。