这“⼀⼝”和那“一口”有什么不同,关于unicode一个小知识

本文探讨了Unicode中的“⼀⼝”与“一口”的差异,指出前者是汉字部首,后者为常用汉字。Unicode中,部首属于KANGXI RADICAL,共有214个,而汉字主要位于CJK Unified Ideographs范围内。通过Unicode正规化(NFC, NFKC, NFD, NFKD),不同的字符形式可以映射到同一字符,确保比较一致性。在处理汉字时,将“⼀⼝”转换为“一口”可以提高显示兼容性。" 129039437,14928496,Python面向对象编程进阶:构造函数与属性详解,"['Python', '开发语言', '面向对象']

虽然这“⼀⼝”和那“一口”大体是相似的,不过仔细一点儿看就会发现它们的字体并不相同(如果字体支持的不够的话,很有可能这“⼀⼝”还会显示不出来)。这里,如果把文字拷贝到代码中获取一下他们的unicode编码,就会发现,这“⼀⼝”对应的是\u2f00\u2f1d,而那“一口”对应的是\u4e00\u53e3

为什么这两口会有这样的差别呢,其实谨慎的说,这“⼀⼝”并不是汉字,而是汉字的部首,在unicode的标准中有一个专门的分类来标识部首,叫做“KANGXI RADICAL”。在这里看到“部首”不需要惊慌,打开家里的《新华字典》翻到部首检字表,那个部首的列表,就是我们这里说到的unicode的部首的列表,可能在总数上略微有些差别,但是大体的意思是没问题的。在unicode中,康熙部首(KANGXI RADICAL)总共有214个,编码范围是从U+2F00到U+2FD5,内容是根据《康熙字典》来定义的,具体可以参考维基百科的康熙字体词条。而我们一般所用的汉字,在unicode中是在主要是指CJK Unified Ideographs,主要的范围是从U+4E00到U+9FFF,当然还包括很多扩展范围,具体可以也可以看到维基百科的对应词条

以上就是这“⼀⼝”和那“一口”的区别,但是除了区别之外,这“⼀⼝”和那“一口”还是有联系的,这个联系就是unicode的正规化。unicode正规化根据每一个字的具体的含义,把一些相同字的不同变形都对应到了同一个字符上,这样就可以方便一些本来应该是同一个字的不同字符的比较。unicode正规化也会分为几种类型,分别是NFC,NFKC,NFD,NFKD,这些类型的命名中NF就是normal form的缩写,C(Canonical)表示是规范的,K(Compitable)表示兼容的,也就是一些相对通用但是并非标准的也可以涵盖,D(Decomposition)表示分解,比如㉂(U+3242)这个字符的NFKD就是"(自)",从一个字符变成了三个字符。那么现在就可以说回这“⼀⼝”和那“一口”了,如果把这“⼀⼝”转换成而来NFKC或者NFKD的形式,就会成为那“一口”。在一些汉字处理的操作中,因为这“⼀⼝”可能字体的支持没有那么好,把文章整体处理成那“一口”,也是一种保障体验的方法。

下面把全部的KANGXI RADICAL的unicode字符以及该字符所对应的不同的正规化的形式,都列在了下面的表格上

RadicalUnicodeNFCNFKCNFDNFKD
U+2F00⼀ (U+2F00)一 (U+4E00)⼀ (U+2F00)一 (U+4E00)
U+2F01⼁ (U+2F01)丨 (U+4E28)⼁ (U+2F01)丨 (U+4E28)
U+2F02⼂ (U+2F02)丶 (U+4E36)⼂ (U+2F02)丶 (U+4E36)
U+2F03⼃ (U+2F03)丿 (U+4E3F)⼃ (U+2F03)丿 (U+4E3F)
U+2F04⼄ (U+2F04)乙 (U+4E59)⼄ (U+2F04)乙 (U+4E59)
U+2F05⼅ (U+2F05)亅 (U+4E85)⼅ (U+2F05)亅 (U+4E85)
U+2F06⼆ (U+2F06)二 (U+4E8C)⼆ (U+2F06)二 (U+4E8C)
U+2F07⼇ (U+2F07)亠 (U+4EA0)⼇ (U+2F07)亠 (U+4EA0)
U+2F08⼈ (U+2F08)人 (U+4EBA)⼈ (U+2F08)人 (U+4EBA)
U+2F09⼉ (U+2F09)儿 (U+513F)⼉ (U+2F09)儿 (U+513F)
U+2F0A⼊ (U+2F0A)入 (U+5165)⼊ (U+2F0A)入 (U+5165)
U+2F0B⼋ (U+2F0B)八 (U+516B)⼋ (U+2F0B)八 (U+516B)
U+2F0C⼌ (U+2F0C)冂 (U+5182)⼌ (U+2F0C)冂 (U+5182)
U+2F0D⼍ (U+2F0D)冖 (U+5196)⼍ (U+2F0D)冖 (U+5196)
U+2F0E⼎ (U+2F0E)冫 (U+51AB)⼎ (U+2F0E)冫 (U+51AB)
U+2F0F⼏ (U+2F0F)几 (U+51E0)⼏ (U+2F0F)几 (U+51E0)
U+2F10⼐ (U+2F10)凵 (U+51F5)⼐ (U+2F10)凵 (U+51F5)
U+2F11⼑ (U+2F11)刀 (U+5200)⼑ (U+2F11)刀 (U+5200)
U+2F12⼒ (U+2F12)力 (U+529B)⼒ (U+2F12)力 (U+529B)
U+2F13⼓ (U+2F13)勹 (U+52F9)⼓ (U+2F13)勹 (U+52F9)
U+2F14⼔ (U+2F14)匕 (U+5315)⼔ (U+2F14)匕 (U+5315)
U+2F15⼕ (U+2F15)匚 (U+531A)⼕ (U+2F15)匚 (U+531A)
U+2F16⼖ (U+2F16)匸 (U+5338)⼖ (U+2F16)匸 (U+5338)
U+2F17⼗ (U+2F17)十 (U+5341)⼗ (U+2F17)十 (U+5341)
U+2F18⼘ (U+2F18)卜 (U+535C)⼘ (U+2F18)卜 (U+535C)
U+2F19⼙ (U+2F19)卩 (U+5369)⼙ (U+2F19)卩 (U+5369)
U+2F1A⼚ (U+2F1A)厂 (U+5382)⼚ (U+2F1A)厂 (U+5382)
U+2F1B⼛ (U+2F1B)厶 (U+53B6)⼛ (U+2F1B)厶 (U+53B6)
U+2F1C⼜ (U+2F1C)又 (U+53C8)⼜ (U+2F1C)又 (U+53C8)
U+2F1D⼝ (U+2F1D)口 (U+53E3)⼝ (U+2F1D)口 (U+53E3)
U+2F1E⼞ (U+2F1E)囗 (U+56D7)⼞ (U+2F1E)囗 (U+56D7)
U+2F1F⼟ (U+2F1F)土 (U+571F)⼟ (U+2F1F)土 (U+571F)
U+2F20⼠ (U+2F20)士 (U+58EB)⼠ (U+2F20)士 (U+58EB)
U+2F21⼡ (U+2F21)夂 (U+5902)⼡ (U+2F21)夂 (U+5902)
U+2F22⼢ (U+2F22)夊 (U+590A)⼢ (U+2F22)夊 (U+590A)
U+2F23⼣ (U+2F23)夕 (U+5915)⼣ (U+2F23)夕 (U+5915)
U+2F24⼤ (U+2F24)大 (U+5927)⼤ (U+2F24)大 (U+5927)
U+2F25⼥ (U+2F25)女 (U+5973)⼥ (U+2F25)女 (U+5973)
U+2F26⼦ (U+2F26)子 (U+5B50)⼦ (U+2F26)子 (U+5B50)
U+2F27⼧ (U+2F27)宀 (U+5B80)⼧ (U+2F27)宀 (U+5B80)
U+2F28⼨ (U+2F28)寸 (U+5BF8)⼨ (U+2F28)寸 (U+5BF8)
U+2F29⼩ (U+2F29)小 (U+5C0F)⼩ (U+2F29)小 (U+5C0F)
U+2F2A⼪ (U+2F2A)尢 (U+5C22)⼪ (U+2F2A)尢 (U+5C22)
U+2F2B⼫ (U+2F2B)尸 (U+5C38)⼫ (U+2F2B)尸 (U+5C38)
U+2F2C⼬ (U+2F2C)屮 (U+5C6E)⼬ (U+2F2C)屮 (U+5C6E)
U+2F2D⼭ (U+2F2D)山 (U+5C71)⼭ (U+2F2D)山 (U+5C71)
U+2F2E⼮ (U+2F2E)巛 (U+5DDB)⼮ (U+2F2E)巛 (U+5DDB)
U+2F2F⼯ (U+2F2F)工 (U+5DE5)⼯ (U+2F2F)工 (U+5DE5)
U+2F30⼰ (U+2F30)己 (U+5DF1)⼰ (U+2F30)己 (U+5DF1)
U+2F31⼱ (U+2F31)巾 (U+5DFE)⼱ (U+2F31)巾 (U+5DFE)
U+2F32⼲ (U+2F32)干 (U+5E72)⼲ (U+2F32)干 (U+5E72)
U+2F33⼳ (U+2F33)幺 (U+5E7A)⼳ (U+2F33)幺 (U+5E7A)
U+2F34⼴ (U+2F34)广 (U+5E7F)⼴ (U+2F34)广 (U+5E7F)
U+2F35⼵ (U+2F35)廴 (U+5EF4)⼵ (U+2F35)廴 (U+5EF4)
U+2F36⼶ (U+2F36)廾 (U+5EFE)⼶ (U+2F36)廾 (U+5EFE)
U+2F37⼷ (U+2F37)弋 (U+5F0B)⼷ (U+2F37)弋 (U+5F0B)
U+2F38⼸ (U+2F38)弓 (U+5F13)⼸ (U+2F38)弓 (U+5F13)
U+2F39⼹ (U+2F39)彐 (U+5F50)⼹ (U+2F39)彐 (U+5F50)
U+2F3A⼺ (U+2F3A)彡 (U+5F61)⼺ (U+2F3A)彡 (U+5F61)
U+2F3B⼻ (U+2F3B)彳 (U+5F73)⼻ (U+2F3B)彳 (U+5F73)
U+2F3C⼼ (U+2F3C)心 (U+5FC3)⼼ (U+2F3C)心 (U+5FC3)
U+2F3D⼽ (U+2F3D)戈 (U+6208)⼽ (U+2F3D)戈 (U+6208)
U+2F3E⼾ (U+2F3E)戶 (U+6236)⼾ (U+2F3E)戶 (U+6236)
⼿U+2F3F⼿ (U+2F3F)手 (U+624B)⼿ (U+2F3F)手 (U+624B)
U+2F40⽀ (U+2F40)支 (U+652F)⽀ (U+2F40)支 (U+652F)
U+2F41⽁ (U+2F41)攴 (U+6534)⽁ (U+2F41)攴 (U+6534)
U+2F42⽂ (U+2F42)文 (U+6587)⽂ (U+2F42)文 (U+6587)
U+2F43⽃ (U+2F43)斗 (U+6597)⽃ (U+2F43)斗 (U+6597)
U+2F44⽄ (U+2F44)斤 (U+65A4)⽄ (U+2F44)斤 (U+65A4)
U+2F45⽅ (U+2F45)方 (U+65B9)⽅ (U+2F45)方 (U+65B9)
U+2F46⽆ (U+2F46)无 (U+65E0)⽆ (U+2F46)无 (U+65E0)
U+2F47⽇ (U+2F47)日 (U+65E5)⽇ (U+2F47)日 (U+65E5)
U+2F48⽈ (U+2F48)曰 (U+66F0)⽈ (U+2F48)曰 (U+66F0)
U+2F49⽉ (U+2F49)月 (U+6708)⽉ (U+2F49)月 (U+6708)
U+2F4A⽊ (U+2F4A)木 (U+6728)⽊ (U+2F4A)木 (U+6728)
U+2F4B⽋ (U+2F4B)欠 (U+6B20)⽋ (U+2F4B)欠 (U+6B20)
U+2F4C⽌ (U+2F4C)止 (U+6B62)⽌ (U+2F4C)止 (U+6B62)
U+2F4D⽍ (U+2F4D)歹 (U+6B79)⽍ (U+2F4D)歹 (U+6B79)
U+2F4E⽎ (U+2F4E)殳 (U+6BB3)⽎ (U+2F4E)殳 (U+6BB3)
U+2F4F⽏ (U+2F4F)毋 (U+6BCB)⽏ (U+2F4F)毋 (U+6BCB)
U+2F50⽐ (U+2F50)比 (U+6BD4)⽐ (U+2F50)比 (U+6BD4)
U+2F51⽑ (U+2F51)毛 (U+6BDB)⽑ (U+2F51)毛 (U+6BDB)
U+2F52⽒ (U+2F52)氏 (U+6C0F)⽒ (U+2F52)氏 (U+6C0F)
U+2F53⽓ (U+2F53)气 (U+6C14)⽓ (U+2F53)气 (U+6C14)
U+2F54⽔ (U+2F54)水 (U+6C34)⽔ (U+2F54)水 (U+6C34)
U+2F55⽕ (U+2F55)火 (U+706B)⽕ (U+2F55)火 (U+706B)
U+2F56⽖ (U+2F56)爪 (U+722A)⽖ (U+2F56)爪 (U+722A)
U+2F57⽗ (U+2F57)父 (U+7236)⽗ (U+2F57)父 (U+7236)
U+2F58⽘ (U+2F58)爻 (U+723B)⽘ (U+2F58)爻 (U+723B)
U+2F59⽙ (U+2F59)爿 (U+723F)⽙ (U+2F59)爿 (U+723F)
U+2F5A⽚ (U+2F5A)片 (U+7247)⽚ (U+2F5A)片 (U+7247)
U+2F5B⽛ (U+2F5B)牙 (U+7259)⽛ (U+2F5B)牙 (U+7259)
U+2F5C⽜ (U+2F5C)牛 (U+725B)⽜ (U+2F5C)牛 (U+725B)
U+2F5D⽝ (U+2F5D)犬 (U+72AC)⽝ (U+2F5D)犬 (U+72AC)
U+2F5E⽞ (U+2F5E)玄 (U+7384)⽞ (U+2F5E)玄 (U+7384)
U+2F5F⽟ (U+2F5F)玉 (U+7389)⽟ (U+2F5F)玉 (U+7389)
U+2F60⽠ (U+2F60)瓜 (U+74DC)⽠ (U+2F60)瓜 (U+74DC)
U+2F61⽡ (U+2F61)瓦 (U+74E6)⽡ (U+2F61)瓦 (U+74E6)
U+2F62⽢ (U+2F62)甘 (U+7518)⽢ (U+2F62)甘 (U+7518)
U+2F63⽣ (U+2F63)生 (U+751F)⽣ (U+2F63)生 (U+751F)
U+2F64⽤ (U+2F64)用 (U+7528)⽤ (U+2F64)用 (U+7528)
U+2F65⽥ (U+2F65)田 (U+7530)⽥ (U+2F65)田 (U+7530)
U+2F66⽦ (U+2F66)疋 (U+758B)⽦ (U+2F66)疋 (U+758B)
U+2F67⽧ (U+2F67)疒 (U+7592)⽧ (U+2F67)疒 (U+7592)
U+2F68⽨ (U+2F68)癶 (U+7676)⽨ (U+2F68)癶 (U+7676)
U+2F69⽩ (U+2F69)白 (U+767D)⽩ (U+2F69)白 (U+767D)
U+2F6A⽪ (U+2F6A)皮 (U+76AE)⽪ (U+2F6A)皮 (U+76AE)
U+2F6B⽫ (U+2F6B)皿 (U+76BF)⽫ (U+2F6B)皿 (U+76BF)
U+2F6C⽬ (U+2F6C)目 (U+76EE)⽬ (U+2F6C)目 (U+76EE)
U+2F6D⽭ (U+2F6D)矛 (U+77DB)⽭ (U+2F6D)矛 (U+77DB)
U+2F6E⽮ (U+2F6E)矢 (U+77E2)⽮ (U+2F6E)矢 (U+77E2)
U+2F6F⽯ (U+2F6F)石 (U+77F3)⽯ (U+2F6F)石 (U+77F3)
U+2F70⽰ (U+2F70)示 (U+793A)⽰ (U+2F70)示 (U+793A)
U+2F71⽱ (U+2F71)禸 (U+79B8)⽱ (U+2F71)禸 (U+79B8)
U+2F72⽲ (U+2F72)禾 (U+79BE)⽲ (U+2F72)禾 (U+79BE)
U+2F73⽳ (U+2F73)穴 (U+7A74)⽳ (U+2F73)穴 (U+7A74)
U+2F74⽴ (U+2F74)立 (U+7ACB)⽴ (U+2F74)立 (U+7ACB)
U+2F75⽵ (U+2F75)竹 (U+7AF9)⽵ (U+2F75)竹 (U+7AF9)
U+2F76⽶ (U+2F76)米 (U+7C73)⽶ (U+2F76)米 (U+7C73)
U+2F77⽷ (U+2F77)糸 (U+7CF8)⽷ (U+2F77)糸 (U+7CF8)
U+2F78⽸ (U+2F78)缶 (U+7F36)⽸ (U+2F78)缶 (U+7F36)
U+2F79⽹ (U+2F79)网 (U+7F51)⽹ (U+2F79)网 (U+7F51)
U+2F7A⽺ (U+2F7A)羊 (U+7F8A)⽺ (U+2F7A)羊 (U+7F8A)
U+2F7B⽻ (U+2F7B)羽 (U+7FBD)⽻ (U+2F7B)羽 (U+7FBD)
U+2F7C⽼ (U+2F7C)老 (U+8001)⽼ (U+2F7C)老 (U+8001)
U+2F7D⽽ (U+2F7D)而 (U+800C)⽽ (U+2F7D)而 (U+800C)
U+2F7E⽾ (U+2F7E)耒 (U+8012)⽾ (U+2F7E)耒 (U+8012)
⽿U+2F7F⽿ (U+2F7F)耳 (U+8033)⽿ (U+2F7F)耳 (U+8033)
U+2F80⾀ (U+2F80)聿 (U+807F)⾀ (U+2F80)聿 (U+807F)
U+2F81⾁ (U+2F81)肉 (U+8089)⾁ (U+2F81)肉 (U+8089)
U+2F82⾂ (U+2F82)臣 (U+81E3)⾂ (U+2F82)臣 (U+81E3)
U+2F83⾃ (U+2F83)自 (U+81EA)⾃ (U+2F83)自 (U+81EA)
U+2F84⾄ (U+2F84)至 (U+81F3)⾄ (U+2F84)至 (U+81F3)
U+2F85⾅ (U+2F85)臼 (U+81FC)⾅ (U+2F85)臼 (U+81FC)
U+2F86⾆ (U+2F86)舌 (U+820C)⾆ (U+2F86)舌 (U+820C)
U+2F87⾇ (U+2F87)舛 (U+821B)⾇ (U+2F87)舛 (U+821B)
U+2F88⾈ (U+2F88)舟 (U+821F)⾈ (U+2F88)舟 (U+821F)
U+2F89⾉ (U+2F89)艮 (U+826E)⾉ (U+2F89)艮 (U+826E)
U+2F8A⾊ (U+2F8A)色 (U+8272)⾊ (U+2F8A)色 (U+8272)
U+2F8B⾋ (U+2F8B)艸 (U+8278)⾋ (U+2F8B)艸 (U+8278)
U+2F8C⾌ (U+2F8C)虍 (U+864D)⾌ (U+2F8C)虍 (U+864D)
U+2F8D⾍ (U+2F8D)虫 (U+866B)⾍ (U+2F8D)虫 (U+866B)
U+2F8E⾎ (U+2F8E)血 (U+8840)⾎ (U+2F8E)血 (U+8840)
U+2F8F⾏ (U+2F8F)行 (U+884C)⾏ (U+2F8F)行 (U+884C)
U+2F90⾐ (U+2F90)衣 (U+8863)⾐ (U+2F90)衣 (U+8863)
U+2F91⾑ (U+2F91)襾 (U+897E)⾑ (U+2F91)襾 (U+897E)
U+2F92⾒ (U+2F92)見 (U+898B)⾒ (U+2F92)見 (U+898B)
U+2F93⾓ (U+2F93)角 (U+89D2)⾓ (U+2F93)角 (U+89D2)
U+2F94⾔ (U+2F94)言 (U+8A00)⾔ (U+2F94)言 (U+8A00)
U+2F95⾕ (U+2F95)谷 (U+8C37)⾕ (U+2F95)谷 (U+8C37)
U+2F96⾖ (U+2F96)豆 (U+8C46)⾖ (U+2F96)豆 (U+8C46)
U+2F97⾗ (U+2F97)豕 (U+8C55)⾗ (U+2F97)豕 (U+8C55)
U+2F98⾘ (U+2F98)豸 (U+8C78)⾘ (U+2F98)豸 (U+8C78)
U+2F99⾙ (U+2F99)貝 (U+8C9D)⾙ (U+2F99)貝 (U+8C9D)
U+2F9A⾚ (U+2F9A)赤 (U+8D64)⾚ (U+2F9A)赤 (U+8D64)
U+2F9B⾛ (U+2F9B)走 (U+8D70)⾛ (U+2F9B)走 (U+8D70)
U+2F9C⾜ (U+2F9C)足 (U+8DB3)⾜ (U+2F9C)足 (U+8DB3)
U+2F9D⾝ (U+2F9D)身 (U+8EAB)⾝ (U+2F9D)身 (U+8EAB)
U+2F9E⾞ (U+2F9E)車 (U+8ECA)⾞ (U+2F9E)車 (U+8ECA)
U+2F9F⾟ (U+2F9F)辛 (U+8F9B)⾟ (U+2F9F)辛 (U+8F9B)
U+2FA0⾠ (U+2FA0)辰 (U+8FB0)⾠ (U+2FA0)辰 (U+8FB0)
U+2FA1⾡ (U+2FA1)辵 (U+8FB5)⾡ (U+2FA1)辵 (U+8FB5)
U+2FA2⾢ (U+2FA2)邑 (U+9091)⾢ (U+2FA2)邑 (U+9091)
U+2FA3⾣ (U+2FA3)酉 (U+9149)⾣ (U+2FA3)酉 (U+9149)
U+2FA4⾤ (U+2FA4)釆 (U+91C6)⾤ (U+2FA4)釆 (U+91C6)
U+2FA5⾥ (U+2FA5)里 (U+91CC)⾥ (U+2FA5)里 (U+91CC)
U+2FA6⾦ (U+2FA6)金 (U+91D1)⾦ (U+2FA6)金 (U+91D1)
U+2FA7⾧ (U+2FA7)長 (U+9577)⾧ (U+2FA7)長 (U+9577)
U+2FA8⾨ (U+2FA8)門 (U+9580)⾨ (U+2FA8)門 (U+9580)
U+2FA9⾩ (U+2FA9)阜 (U+961C)⾩ (U+2FA9)阜 (U+961C)
U+2FAA⾪ (U+2FAA)隶 (U+96B6)⾪ (U+2FAA)隶 (U+96B6)
U+2FAB⾫ (U+2FAB)隹 (U+96B9)⾫ (U+2FAB)隹 (U+96B9)
U+2FAC⾬ (U+2FAC)雨 (U+96E8)⾬ (U+2FAC)雨 (U+96E8)
U+2FAD⾭ (U+2FAD)靑 (U+9751)⾭ (U+2FAD)靑 (U+9751)
U+2FAE⾮ (U+2FAE)非 (U+975E)⾮ (U+2FAE)非 (U+975E)
U+2FAF⾯ (U+2FAF)面 (U+9762)⾯ (U+2FAF)面 (U+9762)
U+2FB0⾰ (U+2FB0)革 (U+9769)⾰ (U+2FB0)革 (U+9769)
U+2FB1⾱ (U+2FB1)韋 (U+97CB)⾱ (U+2FB1)韋 (U+97CB)
U+2FB2⾲ (U+2FB2)韭 (U+97ED)⾲ (U+2FB2)韭 (U+97ED)
U+2FB3⾳ (U+2FB3)音 (U+97F3)⾳ (U+2FB3)音 (U+97F3)
U+2FB4⾴ (U+2FB4)頁 (U+9801)⾴ (U+2FB4)頁 (U+9801)
U+2FB5⾵ (U+2FB5)風 (U+98A8)⾵ (U+2FB5)風 (U+98A8)
U+2FB6⾶ (U+2FB6)飛 (U+98DB)⾶ (U+2FB6)飛 (U+98DB)
U+2FB7⾷ (U+2FB7)食 (U+98DF)⾷ (U+2FB7)食 (U+98DF)
U+2FB8⾸ (U+2FB8)首 (U+9996)⾸ (U+2FB8)首 (U+9996)
U+2FB9⾹ (U+2FB9)香 (U+9999)⾹ (U+2FB9)香 (U+9999)
U+2FBA⾺ (U+2FBA)馬 (U+99AC)⾺ (U+2FBA)馬 (U+99AC)
U+2FBB⾻ (U+2FBB)骨 (U+9AA8)⾻ (U+2FBB)骨 (U+9AA8)
U+2FBC⾼ (U+2FBC)高 (U+9AD8)⾼ (U+2FBC)高 (U+9AD8)
U+2FBD⾽ (U+2FBD)髟 (U+9ADF)⾽ (U+2FBD)髟 (U+9ADF)
U+2FBE⾾ (U+2FBE)鬥 (U+9B25)⾾ (U+2FBE)鬥 (U+9B25)
⾿U+2FBF⾿ (U+2FBF)鬯 (U+9B2F)⾿ (U+2FBF)鬯 (U+9B2F)
U+2FC0⿀ (U+2FC0)鬲 (U+9B32)⿀ (U+2FC0)鬲 (U+9B32)
U+2FC1⿁ (U+2FC1)鬼 (U+9B3C)⿁ (U+2FC1)鬼 (U+9B3C)
U+2FC2⿂ (U+2FC2)魚 (U+9B5A)⿂ (U+2FC2)魚 (U+9B5A)
U+2FC3⿃ (U+2FC3)鳥 (U+9CE5)⿃ (U+2FC3)鳥 (U+9CE5)
U+2FC4⿄ (U+2FC4)鹵 (U+9E75)⿄ (U+2FC4)鹵 (U+9E75)
U+2FC5⿅ (U+2FC5)鹿 (U+9E7F)⿅ (U+2FC5)鹿 (U+9E7F)
U+2FC6⿆ (U+2FC6)麥 (U+9EA5)⿆ (U+2FC6)麥 (U+9EA5)
U+2FC7⿇ (U+2FC7)麻 (U+9EBB)⿇ (U+2FC7)麻 (U+9EBB)
U+2FC8⿈ (U+2FC8)黃 (U+9EC3)⿈ (U+2FC8)黃 (U+9EC3)
U+2FC9⿉ (U+2FC9)黍 (U+9ECD)⿉ (U+2FC9)黍 (U+9ECD)
U+2FCA⿊ (U+2FCA)黑 (U+9ED1)⿊ (U+2FCA)黑 (U+9ED1)
U+2FCB⿋ (U+2FCB)黹 (U+9EF9)⿋ (U+2FCB)黹 (U+9EF9)
U+2FCC⿌ (U+2FCC)黽 (U+9EFD)⿌ (U+2FCC)黽 (U+9EFD)
U+2FCD⿍ (U+2FCD)鼎 (U+9F0E)⿍ (U+2FCD)鼎 (U+9F0E)
U+2FCE⿎ (U+2FCE)鼓 (U+9F13)⿎ (U+2FCE)鼓 (U+9F13)
U+2FCF⿏ (U+2FCF)鼠 (U+9F20)⿏ (U+2FCF)鼠 (U+9F20)
U+2FD0⿐ (U+2FD0)鼻 (U+9F3B)⿐ (U+2FD0)鼻 (U+9F3B)
U+2FD1⿑ (U+2FD1)齊 (U+9F4A)⿑ (U+2FD1)齊 (U+9F4A)
U+2FD2⿒ (U+2FD2)齒 (U+9F52)⿒ (U+2FD2)齒 (U+9F52)
U+2FD3⿓ (U+2FD3)龍 (U+9F8D)⿓ (U+2FD3)龍 (U+9F8D)
U+2FD4⿔ (U+2FD4)龜 (U+9F9C)⿔ (U+2FD4)龜 (U+9F9C)
U+2FD5⿕ (U+2FD5)龠 (U+9FA0)⿕ (U+2FD5)龠 (U+9FA0)

生成这个表格(.csv)的Python代码如下:

# -*- coding: utf-8 -*-
import csv
from unicodedata import normalize


def unicode_repr(ch):
    return 'U+%s' % hex(ord(ch))[-4:].upper()


def normalized_repr(form, ch):
    base = '%s (%s)'
    return base % (normalize(form, ch),
                   unicode_repr(normalize(form, ch))) 


def run(fileobj):
    writer = csv.writer(fileobj)
    writer.writerow(["Radical", "Unicode", "NFC", "NFKC", "NFD", "NFKD"])
    for x in range(ord('\u2f00'), ord('\u2fd6') + 1):
        ch = chr(x)
        row = [ch,
               unicode_repr(ch),
               normalized_repr('NFC', ch),
               normalized_repr('NFKC', ch),
               normalized_repr('NFD', ch),
               normalized_repr('NFKD', ch)]
        writer.writerow(row)

run(open('unicode_kangxi_radical.csv', 'w'))

 

 

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值