在google code上又开源了一个项目(http://code.google.com/p/lightwords/ ):
lightwords是一个中分分词引擎,用双数组Trie树作为词典结构,采用最短N路径算法构造词图粗切分,后期加工采用隐马尔科夫模型(HMM)进行人名地名识别和词性标注。开发语言是C++。
LightWords是一款中文分词引擎,使用双数组Trie树作为词典结构,并结合最短N路径算法及隐马尔科夫模型(HMM),实现高效的人名地名识别和词性标注。该引擎采用C++开发。
在google code上又开源了一个项目(http://code.google.com/p/lightwords/ ):
lightwords是一个中分分词引擎,用双数组Trie树作为词典结构,采用最短N路径算法构造词图粗切分,后期加工采用隐马尔科夫模型(HMM)进行人名地名识别和词性标注。开发语言是C++。
5632

被折叠的 条评论
为什么被折叠?