搜索
IndexWriter 索引过程核心组件
Directory
FSDirectory 索引文件存储在硬盘上
RAMDirectory 索引文件存储在内存中
Analyzer 文件被索引前,在查询时,都需要使用Analyzer来分词
Document 一个被索引的基本单元 每个Document包含一个或多个不同命名的域
Field
Keyword 不需要被分析
UnIndexed 既不需要被分析也不进行索引,适合于需要和搜索结果一起被显示出来的情况
UnStored 需要分析并索引(如网页的正文)
Text 需要被分析且索引(最好不要使用,这个类型定义的不好)
索引
IndexSearcher 用于搜索IndexWriter所创建的索引
Term 用于搜索的一个基本单元,它包含了一对字符串元素,和域中name和value相对应
Query 查询类型的父类
TermQuery Lucene提供的最基本的查询类型
Hits 存放有序搜索结果指针的简单容器,结果只会每次返回一部分
本文深入探讨了Lucene的索引过程,包括核心组件如Directory、Analyzer、Document、Field等,以及如何使用IndexWriter创建索引和IndexSearcher进行搜索。详细解释了索引文件的存储方式、分词过程、文档结构以及查询机制。
1213

被折叠的 条评论
为什么被折叠?



