1. Unicode是全球文字统一编码。它把世界上的各种文字的每一个字符指定唯一编码, 实现跨语种、跨平台的应用。
2. 中文用户最常接触的汉字编码是Unicode。中文字符数量巨大, 日常使用的汉字数量有数千个, 再加上生僻字, 数量达到数万个。
3. 下面这个表格列出了中文字符集的Unicode编码范围
|
字符集 |
字数 |
Unicode编码 |
|
CJK部首补充 |
128字 |
2E80-2EFF |
|
康熙字典部首 |
224字 |
2F00-2FDF |
|
表意文字描述符 |
16字 |
2FF0-2FFF |
|
CJK符号和标点 |
64字 |
3000-303F |
|
注音字母 |
46字 |
3100-312F |
|
注音字母扩展 |
32字 |
31A0-31BF |
|
CJK笔画 |
48字 |
31C0-31EF |
|
封闭式CJK文字和月份 |
256字 |
3200–32FF |
|
CJK兼容 |
256字 |
3300–33FF |
|
CJK统一表意文字扩展A |
6592字 |
3400-4DBF |
|
CJK统一表意文字(基本汉字) |
20989字 |
4E00-9FFC |
|
CJK兼容表意文字 |
512字 |
F900-FAD9 |
|
CJK兼容形式 |
32字 |
FE30–FE4F |
|
CJK统一表意文字扩展B |
42718字 |
20000-2A6DD |
|
CJK统一表意文字扩展C |
4149字 |
2A700-2B734 |
|
CJK统一表意文字扩展D |
222字 |
2B740-2B81D |
|
CJK统一表意文字扩展E |
5762字 |
2B820-2CEA1 |
|
CJK统一表意文字扩展F |
7473字 |
2CEB0-2EBE0 |
|
CJK兼容表意文字补充 |
544字 |
2F800-2FA1F |
|
CJK统一表意文字扩展G |
4939字 |
30000-3134A |
Unicode是全球统一的文字编码标准,确保了不同语言字符的唯一表示。中文用户广泛使用Unicode,尤其是对于庞大的汉字字符集。这篇内容详细列举了中文字符在Unicode编码中的各个范围,包括CJK部首、表意文字描述符、注音字母等,覆盖了从基本汉字到扩展区域的大量字符,为理解和处理中文字符编码提供了基础。
666

被折叠的 条评论
为什么被折叠?



