Lucene之HelloWorld

最新推荐文章于 2019-01-05 10:08:32 发布

原创最新推荐文章于 2019-01-05 10:08:32 发布 · 295 阅读

0 ·

CC 4.0 BY-SA版权

Lucene 专栏收录该内容

1 篇文章

订阅专栏

本文介绍了一款用于全文检索和搜索的强大开源库Lucene，并详细解释了如何通过两个关键步骤——添加索引和搜索来实现基本的文件搜索功能。文中还提供了创建索引和搜索文档的具体代码示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Lucene是一套用于全文检索和搜寻的开源程式库，由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口，能够做全文索引和搜寻。在Java开发环境里Lucene是一个成熟的免费开源工具。就其本身而言，Lucene是当前以及最近几年最受欢迎的免费Java信息检索程序库。人们经常提到信息检索程序库，虽然与搜索引擎有关，但不应该将信息检索程序库与搜索引擎相混淆。----来自百度百科

使用Lucene两个关键的步骤是①添加索引②搜索

该HelloWorld程序主要实现的功能是在指定目录下搜索哪些txt文件包含了关键字‘123’

创建该程序前需要创建两个文件夹：E:\Lucene\Data，E:\Lucene\Index。然后在Data文件夹里随便放一些txt文件，Data用于存放被搜索的文件，Index用于存放程序生成的索引

Lucene核心包的Maven坐标：

<dependency>
  <groupId>org.apache.lucene</groupId>
  <artifactId>lucene-core</artifactId>
  <version>3.6.2</version>
</dependency>

目录结构：

关于五个类的作用：

①Indexer：用于给文档添加索引

②LuceneConstants：提供需要使用的各种常量

③LuceneTester：Main程序

④Searcher：用于搜索文档

⑤TextFileFilter：规定要搜索指定目录下的哪种类型的文件

源代码：全贴在博客里有点长，打包了https://pan.baidu.com/s/1pMJ8ic6a5rlemy9jRgt_RA

知道用网盘不专业 but，GitHub还没用顺手- -。。。