
lucene
oklinsong
这个作者很懒,什么都没留下…
展开
-
转载一篇文章,相当棒【全文检索的基本原理】
Lucene 是一个高效的,基于Java 的全文检索库。 所以在了解Lucene之前要费一番工夫了解一下全文检索。那么什么叫做全文检索呢?这要从我们生活中的数据说起。我们生活中的数据总体分为两种:结构化数据 和非结构化数据 。结构化数据: 指具有固定格式或有限转载 2011-10-10 22:48:05 · 856 阅读 · 0 评论 -
Lucene的总体结构
Lucene 的构架和过程如下图, 说明Lucene是有索引和搜索的两个过程.让我们更细一些看Lucene的各组件: 被索引的文档用Document对象表示。 IndexWriter通过函数addDocument将文档添加到索引中,实现创建索引的过程。 Lucene的索引是应用反向索引。 当用户有请求时,Query代表用户的查询语句。 IndexSearcher通过函数sear转载 2011-10-10 22:58:13 · 517 阅读 · 0 评论 -
Lucene学习总结之三:Lucene的索引文件格式(1)
Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙。当我们真正进入到Lucene源代码之中的时候,我们会发现:Lucene的索引过程,就是按照全文检索的基本过程,将倒排表写成此文件格式的过程。 Lucene的搜索过程,就是按照此文件格式将索引进去的信息读出来,然后计算每篇文档打分(score)的过程。 本文详细解读了Ap转载 2011-10-28 15:02:16 · 390 阅读 · 0 评论