
自然语言处理
文章平均质量分 91
DanceFire
这个作者很懒,什么都没留下…
展开
-
中科院中文分词系统ICTCLAS之NShortPath代码的详细分析
这两天我开始看ICTCLAS的实现代码了,和吕震宇的感觉完全一样,代码真的是糟糕透顶,呵呵,非常同情吕震宇和Sinboy能够那么认真地把那些代码读完。有了你们辛苦、认真的分析工作,让我更容易的读懂ICTCLAS的代码了,谢谢了。阅读过程中注意到了他们分析中有些地方有点小错误。 ICTCLAS的命名好像没有正统的学过数据结构一样,对于数据结构的命名非常富有想象力,完全没有按照数据结构上大家公认的原创 2007-04-17 15:15:00 · 15000 阅读 · 5 评论 -
中科院中文分词系统ICTCLAS之CSegment的GenerateWord()详细分析
一、简介这次分析的是ICTCLAS中的//Generate Word according the segmentation routebool CSegment::GenerateWord(int **nSegRoute, int nIndex)本来这个函数没有必要详细分析,但是我注意到中科院论文中并没有描述这个函数、而Sinboy和吕震宇也基本上跳过这个函数不讲了,所以这个函数还原创 2007-05-13 05:47:00 · 11337 阅读 · 6 评论