
中文分词
文章平均质量分 78
mlnotes
这个作者很懒,什么都没留下…
展开
-
最简单的中文分词(最大匹配以及反向最大匹配)
原创 2013-08-01 00:55:38 · 1054 阅读 · 0 评论 -
中文分词算法 mmseg python版本
mmseg算法是对最大匹配算法的扩展。简单来说,mmseg每次匹配时,总会多向后匹配两个单词,然后选择这个三个单词的总体匹配最优的。mmseg 主要做了以下几方面的扩展:假设对字符串C1C2...Cn进行分割 匹配时,从小到大,逐个匹配字典中以C1开头的词每次连续匹配三个词语(three-word chunk ),并列出所有可能的分割选择最匹配的three-word chunk(依次运用以下规则原创 2013-08-01 00:55:40 · 1536 阅读 · 0 评论