
Lucene
文章平均质量分 64
乄浅醉
这个作者很懒,什么都没留下…
展开
-
lucene4.4入门实践
最近需要用到lucene,使用最新版本4.6的版本,发现比较以前学习的3.0版本有很多的改变,包括各种参数配置,而网上搜索到的大部分都是3.0版本的教程,于是只好自己动手,好在有基础,不难... 首先创建索引,其实我很久不用lucene了,以前学习的差不多都忘记了,不过我还记得创建索引对象IndexWriter,使用这个对象,根据eclipse的代码提示,差不多就可以完成了原创 2014-02-08 19:07:03 · 879 阅读 · 0 评论 -
lucene索引库优化二
其实提高索引查询的速度最简洁的方法技术将索引放到内存当中,减少IO,从而提高查询速度: public class MergePolicies { public static void main(String[] args) throws Exception { long start=new Date().getTime(); IOContext context=new IOCont原创 2014-02-10 12:21:01 · 962 阅读 · 0 评论 -
lucene索引库优化一
lucene在3.6版本后提供了索引库的自动优化,但是面临一些大量数据的时候,还是需要手动优化的,一般情况下,不建议手动优化,手动优化十分损耗资源 优化策略一:主要是通过设置IndexWriterConfig对象的一些参数以达到优化的目的: IndexWriterConfig writerConfig=new IndexWriterConfig(Version.LUCE原创 2014-02-10 12:16:25 · 674 阅读 · 0 评论 -
Apache Lucene 几种分词系统
1、 StopAnalyzerStopAnalyzer能过滤词汇中的特定字符串和词汇,并且完成大写转小写的功能。2、 StandardAnalyzerStandardAnalyzer根据空格和符号来完成分词,还可以完成数字、字母、E-mail地址、IP地址以及中文字符的分析处理,还可以支持过滤词表,用来代替StopAnalyzer能够实现的过滤功能。3、 Simpl转载 2014-02-10 14:55:25 · 788 阅读 · 0 评论