
lucene
yiluoAK_47
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Lucence全文搜索框架
Lucence全文搜索框架目录(?)[+]1 lucene简介1.1 什么是luceneLucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。1.2 lucene能做什么要回答这个问题,先要了解luc转载 2014-02-07 15:45:16 · 3988 阅读 · 1 评论 -
lucene4.0与IKAnalyzer的冲突
在网上下载了lucene当前最新版本4.0,以及IKAnalyzer中文分词器的完整发布包。运行之后发现异常:Exception in thread "main" java.lang.VerifyError: class org.wltea.analyzer.lucene.IKAnalyzer overrides final method tokenStream.(Ljava/lang/S转载 2014-02-13 10:01:14 · 7634 阅读 · 0 评论 -
为全文检索方案更新词库
在全文检索应用中,为了提高检索的准确性,我们时常需要定期去更新分词库,以保证各种网络用语、火文(如“屌丝”、“高帅富”,“美富白”),能正确的被识别。 目前对中文分词比较好的插件主要有ik-analyzer、mmseg、庖丁等。ik是目前使用比较广泛,而且作者刚对其进行了更新,目前已经能支持简单的分词歧义排除算法,详细情况请参见ik的开发网站。本文将以ik来测试新添加的分词。转载 2014-11-04 18:42:07 · 2013 阅读 · 0 评论 -
IKAnalyzer 独立使用 配置扩展词库
网上已有不少教程了。http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.htmlhttp://blog.sina.com.cn/s/blog_4c9d7da201013wv2.html这里只说两点:dic文件要用 “无dom的UTF-8”格式编码dic文件最好是放在项目的s转载 2014-11-04 17:04:20 · 2011 阅读 · 1 评论