lucene 核心类

本文深入探讨了Lucene的索引过程,包括核心组件如Directory、Analyzer、Document、Field等,以及如何使用IndexWriter创建索引和IndexSearcher进行搜索。详细解释了索引文件的存储方式、分词过程、文档结构以及查询机制。

搜索

IndexWriter 索引过程核心组件

Directory

            FSDirectory  索引文件存储在硬盘上

            RAMDirectory 索引文件存储在内存中

Analyzer   文件被索引前,在查询时,都需要使用Analyzer来分词

Document  一个被索引的基本单元 每个Document包含一个或多个不同命名的域

Field

       Keyword  不需要被分析

       UnIndexed  既不需要被分析也不进行索引,适合于需要和搜索结果一起被显示出来的情况

       UnStored 需要分析并索引(如网页的正文)

       Text  需要被分析且索引(最好不要使用,这个类型定义的不好)

 

索引

IndexSearcher  用于搜索IndexWriter所创建的索引

Term 用于搜索的一个基本单元,它包含了一对字符串元素,和域中name和value相对应

Query 查询类型的父类

TermQuery Lucene提供的最基本的查询类型

Hits  存放有序搜索结果指针的简单容器,结果只会每次返回一部分

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值