1. Unicode是全球文字统一编码。它把世界上的各种文字的每一个字符指定唯一编码, 实现跨语种、跨平台的应用。
2. 中文用户最常接触的汉字编码是Unicode。中文字符数量巨大, 日常使用的汉字数量有数千个, 再加上生僻字, 数量达到数万个。
3. 下面这个表格列出了中文字符集的Unicode编码范围
字符集 |
字数 |
Unicode编码 |
CJK部首补充 |
128字 |
2E80-2EFF |
康熙字典部首 |
224字 |
2F00-2FDF |
表意文字描述符 |
16字 |
2FF0-2FFF |
CJK符号和标点 |
64字 |
3000-303F |
注音字母 |
46字 |
3100-312F |
注音字母扩展 |
32字 |
31A0-31BF |
CJK笔画 |
48字 |
31C0-31EF |
封闭式CJK文字和月份 |
256字 |
3200–32FF |
CJK兼容 |
256字 |
3300–33FF |
CJK统一表意文字扩展A |
6592字 |
3400-4DBF |
CJK统一表意文字(基本汉字) |
20989字 |
4E00-9FFC |
CJK兼容表意文字 |
512字 |
F900-FAD9 |
CJK兼容形式 |
32字 |
FE30–FE4F |
CJK统一表意文字扩展B |
42718字 |
20000-2A6DD |
CJK统一表意文字扩展C |
4149字 |
2A700-2B734 |
CJK统一表意文字扩展D |
222字 |
2B740-2B81D |
CJK统一表意文字扩展E |
5762字 |
2B820-2CEA1 |
CJK统一表意文字扩展F |
7473字 |
2CEB0-2EBE0 |
CJK兼容表意文字补充 |
544字 |
2F800-2FA1F |
CJK统一表意文字扩展G |
4939字 |
30000-3134A |