
lucence
iteye_13384
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
lucence 支持类似关系数据库的嵌套查询吗?
文章出处:http://blog.youkuaiyun.com/rick_123/article/details/6637121?reload 在这个网页看到这么,如果真的能实现,感觉lucence挺强大的,但是我有点怀疑是不是真的能实现,本人并没有真正试过。 关于BooeanQuery在搜索中的用处 我们在搜索中可能会遇到要搜索索引文件中不同字段,不同字段之间就存在了与或非的运算关系,如:这个...原创 2014-04-17 14:00:47 · 137 阅读 · 0 评论 -
lucence 高亮
一、Lucene 中文引擎,庖丁解牛的辞典参数配置方法(转) 随机文档指示可以在环境变量里配置。原文如下庖丁中文分词需要一套词典,这些词典需要统一存储在某个目录下,这个目录称为词典安装目录。词典安装目录可以是文件系统的任何目录,它不依赖于应用程序的运行目录。将词典拷贝到词典安装目录的过程称为安装词典。增加、删除、修改词典目录下的词典的过程称为自定制词典。在linux下,我们可以考虑将词典安装在...原创 2014-04-21 17:06:51 · 182 阅读 · 0 评论 -
中文分词之Java实现使用IK Analyzer实现
IK Analyzer是基于lucene实现的分词开源框架,下载路径:http://code.google.com/p/ik-analyzer/downloads/list 需要在项目中引入: IKAnalyzer.cfg.xml IKAnalyzer2012.jar lucene-core-3.6.0.jar stopword.dic 什么都不用改 示例代码如下(使用IK Ana...原创 2014-04-24 17:38:23 · 240 阅读 · 0 评论 -
lucence返回高亮之后,就是utf-8接口
lucence返回高亮之后,就是utf-8编码,如果页面内容包含html代码页面会奔溃, 如果在页面上转编码,则会出现原始编码,所有不要在页面转码。 再抽词处理的时候,使用最新版本的抽词,好像可以避免lucence的编码问题 ...原创 2014-05-26 14:12:29 · 135 阅读 · 0 评论 -
如果lucence要部分高亮则需要分词
如果不分词,则只有在搜整个存储字符串的时候,高亮才有效原创 2014-06-03 15:29:52 · 132 阅读 · 0 评论 -
lucence如果要统计的字段必须设为不分词存储
lucence如果要统计的字段必须设为不分词存储原创 2014-06-09 10:12:34 · 308 阅读 · 0 评论