汉语拼音音节的歧义指数
冯志伟
如果不计声调,基本的汉语音节只有405个,这405个汉语音节可以表示全部汉字的读音。而《通用规范汉字表》包含了8105个通用汉字,在这种情况下,在一般使用中,一个汉语音节平均要表示20个以上的汉字(8,105/405 = 20.01)。
例1 在《通用规范汉字表》(2013)中,/bei/这个音节可以表示如下31个汉字:
北 杯 卑 背 椑 悲 碑 鹎 贝 孛 邶 狈 备 钡 倍 悖 被 棓 辈惫焙蓓碚鞁褙糒鞴鐾呗臂
例2 在《通用规范汉字表》(2013)中,/jing/这个音节可以表示如下50个汉字:
京 茎 泾 经 猄 荆 菁 旌 惊 晶 腈 䴖 睛 粳 兢 精 鲸 麖 鼱 井阱汫刭肼颈景儆憬璥璟警劲径净迳经胫倞 痉竞竟竫婧靓敬靖静境獍 镜
这意味着,在表示汉字的时候,汉语拼音音节是存在歧义性的。
歧义指数是汉语拼音音节的歧义程度的数学描述。
一个汉语拼音音节的歧义指数 (I) 等于该拼音音节可以表示的汉字数 (N) 减 1。
计算公式如下:
I = N – 1
这个公式说明,如果一个拼音音节可以表示 N 个汉字,那么,它的歧义指数等于 N – 1。
如果一个拼音音节可以表示一个汉字,那么它的歧义指数为零。如果一个拼音音节可以表示两个汉字,那么,它的歧义指数为 2 – 1 = 1。如果一个拼音音节可以表示三个汉字,那么,它的歧义指数为 3 – 1 = 2. ......等等。
在上述例1中,拼音音节/bei/可以表示31个汉字,它的歧义指数为 31 – 1 = 30;在上述例2中,拼音音节/jing/可以表示50个汉字,它的歧义指数为 50 – 1 = 49。
但是,如果把单音节 /bei/和单音节/jing/结合形成一个双音节的单词 /beijing/,其歧义指数将明显地减少,因为 /beijing/ 只能表示三个双音节的单词:
例3 北京, 背景, 背静
其歧义指数减少为 3 –1 = 2。
如果把 /beijing/的第一个字母进一步大写为/Beijing/,那么,其歧义指数将减少到零:1 – 1 = 0。这说明,/Beijing/是一个没有歧义的单词,它的意思只有1个,这就是中国首都的名称:
例4 北京
因此,如果把不同的单音节的拼音音节连接成多音节的汉语单词,那么,拼音音节的歧义指数将明显地减少。这是把不同的单音节连接成为多音节的汉语单词的优越之处。
正因为汉语拼音音节存在很高的歧义指数,使用汉语拼音作为一种正规的文字是不现实的,汉语拼音永远不能取代汉字。中文的全盘拼音化只不过是一种幻想而已。
但是,在使用拼音时按照《汉语拼音正词法》进行音节连写,有助于减少拼音音节的歧义指数,可以使拼音发挥更好的作用。所以,我拥护《汉语拼音正词法》,拥护在文献工作中推广《汉语拼音正词法》。
650

被折叠的 条评论
为什么被折叠?



