
Lucene
文章平均质量分 82
iteye_2179
这个作者很懒,什么都没留下…
展开
-
Lucene 索引数据库(转载)
Lucene,作为一种全文搜索的辅助工具,为我们进行条件搜索,无论是像Google,Baidu之类的搜索引擎,还是论坛中的搜索功能,还是其它C/S架构的搜索,都带来了极大的便利和比较高的效率。本文主要是利用Lucene对MS Sql Server 2000进行建立索引,然后进行全文索引。至于数据库的内容,可以是网页的内容,还是其它的。本文中数据库的内容是图书馆管理系统中的某个作者表-Autho...原创 2011-06-16 23:13:44 · 90 阅读 · 0 评论 -
Lucene 建立索引的效率 (仍然推荐在内存中建立索引再写回)
为了解决这个问题, Lucene 在内存中持有一块缓冲区。但我们如何控制 Lucene 的缓冲区呢?幸运的是,Lucene 的类 IndexWriter 提供了三个参数用来调整缓冲区的大小以及往磁盘上写索引文件的频率。 1.合并因子(mergeFactor) 这个参数决定了在 Lucene 的一个索引块中可以存放多少文档以及把磁盘上的索引块合并成一个大的索引块的频率。比如,如果合并因子的值...原创 2011-06-16 23:34:44 · 105 阅读 · 0 评论 -
Lucene 2.4更新索引的方法(Update Index)
在Lucene里面没有update方法,我查了文档,我们只能删除以前的索引,然后增加新的索引。 具体步骤是,根据关键词,比如url这个唯一的东西,找到已经存在的索引项,然后删除它, 下面是我的一个根据网页URL删除索引的方法,里面主要使用了Item里面保存的一个docId的int类型的参数 这个数字是lucene内部每个索引的顺序号,类似于rowid @SuppressWarnings("unc...原创 2011-06-16 23:47:40 · 153 阅读 · 0 评论 -
Lucene 2.4更新索引的方法(Update Index)
在Lucene里面没有update方法,我查了文档,我们只能删除以前的索引,然后增加新的索引。 具体步骤是,根据关键词,比如url这个唯一的东西,找到已经存在的索引项,然后删除它, 下面是我的一个根据网页URL删除索引的方法,里面主要使用了Item里面保存的一个docId的int类型的参数 这个数字是lucene内部每个索引的顺序号,类似于rowid @SuppressWarnings("u...原创 2011-06-16 23:54:37 · 146 阅读 · 0 评论