
中文分词
Ellating123
这个作者很懒,什么都没留下…
展开
-
14款中文分词开源软件
链接:http://www.oschina.net/project/tag/264/segment 开源中国社区 1、IKAnalyzer IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出 了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算转载 2014-10-16 16:49:14 · 611 阅读 · 0 评论 -
中文分词算法总结
什么是中文分词 众所周知,英文是以 词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如,英文句子I am a student,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道student是一个单词,但是不能很容易明白“学”、“生”两个字合起来 才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称为切词。我是一个学转载 2016-09-18 22:41:11 · 1095 阅读 · 0 评论