- 博客(4)
- 收藏
- 关注
lucene学习笔记04-分词、中文分词
在建立索引过程中,还有一个非常重要的部分, 就是Analyzer(分词器)。 回想创建IndexWriter对象时,需要一个IndexWriterConfig对象,而这个IndexWriterConfig对象的构造方法,需要一个Analyze对象作为参数。像这样: Directory directory = FSDirectory.open(new File(indexDi...
2015-09-07 15:31:54
166
lucene学习笔记03-基本检索
有了上一篇中建立好的索引,我们就可以完成检索任务了。 在这之前,介绍一下lucene检索有关的基本概念。IndexReader:负责将索引文件读入内存。这里用户可以自定义索引文件编码格式,可以实现索引文件的压缩等。IndexReader的构造方法需要一个Directory对象。IndexSearcher:lucene对外提供检索功能的类。这个类中有多个重载的sear...
2015-09-07 11:27:33
218
原创 lucene学习笔记02-基本索引
上一篇文章中提到,使用lucene包括两个步骤:一是索引;二是检索。索引是基础、是前提,检索是目的。本文讲的是lucene的基本索引。 本文以及后面的文章都以存储在磁盘的文件为背景,进行索引和检索的演示。 对磁盘文件,我们可能有以下的检索需求:按照文件名检索(这个经常有)按照文件路径检索(这个。。。)开玩笑,我们没有这样的检索需求,但是我们需要从检索结果中了解...
2015-09-07 00:05:55
169
lucene学习笔记01-目录
学习lucene也有一段时间,有必要做一个总结。作为自己的知识积累,同时也希望给刚开始接触lucene的人一点帮助。 假设你已经知道lucene是什么、lucene的起源等知识,这些内容在文章中不会做详细的说明。 lucene是一个Java语言实现的、提供全文检索功能的框架。基于lucene,我们可以构建我们自己的搜索引擎。使用lucene包括两个基本步骤:一是建立...
2015-09-06 23:02:18
168
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人