049_汉字Unicode编码范围

原创已于 2024-02-21 12:55:22 修改 · 1.4k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#html #前端

于 2021-08-11 20:15:46 首次发布

html学习专栏收录该内容

89 篇文章

订阅专栏

Unicode是全球统一的文字编码标准，确保了不同语言字符的唯一表示。中文用户广泛使用Unicode，尤其是对于庞大的汉字字符集。这篇内容详细列举了中文字符在Unicode编码中的各个范围，包括CJK部首、表意文字描述符、注音字母等，覆盖了从基本汉字到扩展区域的大量字符，为理解和处理中文字符编码提供了基础。

1. Unicode是全球文字统一编码。它把世界上的各种文字的每一个字符指定唯一编码, 实现跨语种、跨平台的应用。

2. 中文用户最常接触的汉字编码是Unicode。中文字符数量巨大, 日常使用的汉字数量有数千个, 再加上生僻字, 数量达到数万个。

3. 下面这个表格列出了中文字符集的Unicode编码范围

字符集	字数	Unicode编码
CJK部首补充	128字	2E80-2EFF
康熙字典部首	224字	2F00-2FDF
表意文字描述符	16字	2FF0-2FFF
CJK符号和标点	64字	3000-303F
注音字母	46字	3100-312F
注音字母扩展	32字	31A0-31BF
CJK笔画	48字	31C0-31EF
封闭式CJK文字和月份	256字	3200–32FF
CJK兼容	256字	3300–33FF
CJK统一表意文字扩展A	6592字	3400-4DBF
CJK统一表意文字(基本汉字)	20989字	4E00-9FFC
CJK兼容表意文字	512字	F900-FAD9
CJK兼容形式	32字	FE30–FE4F
CJK统一表意文字扩展B	42718字	20000-2A6DD
CJK统一表意文字扩展C	4149字	2A700-2B734
CJK统一表意文字扩展D	222字	2B740-2B81D
CJK统一表意文字扩展E	5762字	2B820-2CEA1
CJK统一表意文字扩展F	7473字	2CEB0-2EBE0
CJK兼容表意文字补充	544字	2F800-2FA1F
CJK统一表意文字扩展G	4939字	30000-3134A