最近在做
KTDictSeg 的 1.3 版本,在这个版本中做了一个用Lucene.net 搜索新闻的例子,其中生成关键词摘要用了
highlighter.net-1.4.0版本,发现中文关键词摘要生成结果总是不对,但英文的结果是对的。没办法,只得把 highlighter.net
的源码拿出来调了一遍,最终发现问题在 TokenGroup类的 IsDistinct函数上。该函数源码如下
highlighter.net-1.4.0版本,发现中文关键词摘要生成结果总是不对,但英文的结果是对的。没办法,只得把 highlighter.net
的源码拿出来调了一遍,最终发现问题在 TokenGroup类的 IsDistinct函数上。该函数源码如下
