最近项目中用到了简单的简繁转换,如果用OpenCC太重了,于是搜到了 zhconv 这个库。
zhconv 提供基于 MediaWiki 词汇表的最大正向匹配简繁转换,Python 2, 3 通用。
支持以下地区词转换:
zh-tw台灣正體zh-hk香港繁體zh-sg马新简体zh-hans简体zh-hant繁體
正好适合我不求转换质量的轻量需求,所以介绍给更多需要的人。
而且虽然该项目stars很少,但中途发现作者还参与过维护jieba分词。
调用也非常简单
>>> from zhconv import convert
>>> convert('Python是一种动态的、面向对象的脚本语言', 'zh-hant')
'Python是一種動態的、面向對象的腳本語言'
复制代码
支持对地区化词语的转换
>>> convert('计算机软件', 'zh-tw')
'計算機軟體'
>>> convert('計算機軟體', 'zh-hans') # zh-hans只是逐字转换
'计算机软体'
>>> convert('計算機軟體', 'zh-cn')
'计算机软件'
复制代码

最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



