主要的类与接口
| 基本类或接口 | 说明 |
| Directory | 表示索引的存储位置,并通常是文件的列表。这些文件被称为索引文件。索引文件通常创建一次,然后用于读操作或可以被删除。 |
| Document | 表示一个虚拟文档与字段,其中字段是可包含在物理文档的内容,它的元数据等的对象。 |
| Analyzer | 负责分析一个文件,并从将被索引的文本获取令牌/字。 |
| IndexWriterConfig | 充当创造/在索引过程中更新指标的核心组成部分 |
| IndexWriter | 索引写操作的类 |
| DirectoryReader | 从索引文件读取的类 |
| IndexSearcher | 从索引文件查找指定目标的类 |
| QueryParser | 用于查询 |
| Query | 用于查询,添加查询条件 |
| TopDocs | 对于查询结果信息的记录 |
| Term | 词元,可用于辅助查询 |
分词器及其相关类
| 分词器及其相关类 | 说明 |
|---|---|
| StandardAnalyzer | 标准分词器,每个汉字是一个词,每段英文是一个词,会忽略某些词 |
| WhitespaceAnalyzer | 空格分词器,以空格分词 |
| SimpleAnalyzer | 简单分词器,结果与空格分词器相似 |
| CJKAnalyzer | 二分法分词器,对于英文,以空格分词,对于中文,会与前后的一个中文分别组词,会忽略指定默认单词 |
| WhitespaceAnalyzer | 空格分词器,以空格分词 |
| KeywordAnalyzer | 关键字分词器,整个一段作为分词结果 |
| StopAnalyzer | 被忽略词分词器,忽略指定单词 |
查询相关类扩展
| 类或接口 | 说明 |
|---|---|
| MultiFieldQueryParser | 对多个域创建查询语句 |
| TermQuery | 词条查询语句 |
| PrefixQuery | 前缀查询语句 |
| PhraseQuery | 短语查询语句 |
| WildcardQuery | 通配符查询语句,Lucene中有 * ? 两个通配符, *表示任意多个字符,?表示一个任意字符 |
| TermRangeQuery | 字符串范围查询 |
| BooleanQuery | 布尔查询 |
博客围绕Lucene展开,介绍了其主要的类与接口,具体涉及分词器及其相关类,还有查询相关类的扩展内容,聚焦信息技术领域中Lucene的相关知识。
1331

被折叠的 条评论
为什么被折叠?



