Lucene初学——4.常用类与说明

最新推荐文章于 2021-11-30 17:12:17 发布

原创最新推荐文章于 2021-11-30 17:12:17 发布 · 182 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

Lucene 专栏收录该内容

4 篇文章

订阅专栏

博客围绕Lucene展开，介绍了其主要的类与接口，具体涉及分词器及其相关类，还有查询相关类的扩展内容，聚焦信息技术领域中Lucene的相关知识。

主要的类与接口

基本类或接口	说明
Directory	表示索引的存储位置，并通常是文件的列表。这些文件被称为索引文件。索引文件通常创建一次，然后用于读操作或可以被删除。
Document	表示一个虚拟文档与字段，其中字段是可包含在物理文档的内容，它的元数据等的对象。
Analyzer	负责分析一个文件，并从将被索引的文本获取令牌/字。
IndexWriterConfig	充当创造/在索引过程中更新指标的核心组成部分
IndexWriter	索引写操作的类
DirectoryReader	从索引文件读取的类
IndexSearcher	从索引文件查找指定目标的类
QueryParser	用于查询
Query	用于查询，添加查询条件
TopDocs	对于查询结果信息的记录
Term	词元，可用于辅助查询

分词器及其相关类

分词器及其相关类	说明
StandardAnalyzer	标准分词器，每个汉字是一个词，每段英文是一个词，会忽略某些词
WhitespaceAnalyzer	空格分词器，以空格分词
SimpleAnalyzer	简单分词器，结果与空格分词器相似
CJKAnalyzer	二分法分词器，对于英文，以空格分词，对于中文，会与前后的一个中文分别组词，会忽略指定默认单词
WhitespaceAnalyzer	空格分词器，以空格分词
KeywordAnalyzer	关键字分词器，整个一段作为分词结果
StopAnalyzer	被忽略词分词器，忽略指定单词

查询相关类扩展

类或接口	说明
MultiFieldQueryParser	对多个域创建查询语句
TermQuery	词条查询语句
PrefixQuery	前缀查询语句
PhraseQuery	短语查询语句
WildcardQuery	通配符查询语句，Lucene中有 * ? 两个通配符， *表示任意多个字符，?表示一个任意字符
TermRangeQuery	字符串范围查询
BooleanQuery	布尔查询

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

future_1024 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。