获取汉语字串的拼音

Unicode汉字转拼音方法
本文介绍了一种简单有效的获取Unicode汉字及其对应拼音的方法,适用于GB2312编码以外的字符集,支持超过27000个常用汉字。文中还提供了一个实现该功能的源代码下载链接。

代码请到这里下载: http://www.hellocpp.net/Articles/Article/731.aspx

网上有很多获取给定汉语字符的拼音的方法。但是个人感觉都不是很全。绝大部分只能获取声母,而且只限于GB2312的编码。

本文提供一个简单的方法。能获取unicode字的拼音。包括韵母。其实这个方法非常非常的简单。可能大家都想到过。只是觉得太简单了。不屑于去用。

方法就是:找个输入法的字符拼音对照表。把这个表逆转过来就可以了。至于内存么。我测试过了。顶多2M的内存。查找速度慢?字符都是有序的,排序后用折半查找。通常情况14次左右的对比就搞定了。绝对不会有问题的。

另外,多音字的确是个问题。最好辅助的找个汉语分词的库,把句子分成词,然后查找词的拼音。这个比较靠谱一些。本文的代码没有处理多音字。但是支持常用词语的查询。大于27000个汉字。
本文的代码直接编译肯定不行的,自己下载了小改一下。包里已经带了我转好的有序表。如果要自己生成有序表(输入表的词汇可以变化的)输入的汉字表如下:


馤ai
騃ai
鯦ai
鱫ai
鴱ai
呆板aiban
爱不释手aibushishou
爱厂如家aichangrujia
挨打aida
爱戴aidai
哀悼aidao
挨饿aie
爱抚aifu
挨个aige
爱国aiguo
爱国侨胞aiguoqiaobao

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值