
lucene
少营营
这个作者很懒,什么都没留下…
展开
-
Lucene介绍
Lucene介绍 1. 目标 理解为什么要学习lucene 理解什么是顺序扫描法 理解什么是倒排索引 理解什么是lucene 2 . 讲解 2.1 为什么要学Lucene 实现商城里面的商品搜索功能,可以根据商品标题模糊查询商品。 原来的方式实现搜索功能,我们的搜索流程如下图: 上图就是原始搜索引擎技术,如果用户比较少而且数据库的数据量比较小,那么这种方式实现搜索功能在...原创 2019-07-21 14:52:08 · 218 阅读 · 0 评论 -
分词器
1 分词理解 在对Docuemnt中的内容进行索引之前,需要使用分词器进行分词 ,分词的目的是为了搜索。分词的主要过程就是先分词后过滤。 分词:采集到的数据会存储到document对象的Field域中,分词就是将Document中Field的value值切分成一个一个的词。 过滤:包括去除标点符号过滤、去除停用词过滤(的、是、a、an、the等)、大写转小写、词的形还原(复数形式转成单数形参...原创 2019-07-21 16:11:54 · 820 阅读 · 1 评论 -
Field属性(域)
1. Field属性 Field是文档中的域,包括Field名和Field值两部分,一个文档可以包括多个Field,Document只是Field的一个承载体,Field值即为要索引的内容,也是要搜索的内容。 是否分词(tokenized) 是:作分词处理,即将Field值进行分词,分词的目的是为了索引。 比如:商品名称、商品描述等,这些内容用户要输入关键字搜索,由于搜索的内容格式大、内容多...原创 2019-07-21 16:27:37 · 5161 阅读 · 0 评论 -
索引维护
索引维护 1. 删除索引 1.1删除指定索引 根据Term项删除索引,满足条件的将全部删除。 @Test public void testIndexDelete() throws Exception { // 创建Directory流对象 Analyzer analyzer = new IKAnalyzer(); Directory directory = ...原创 2019-07-21 16:34:49 · 477 阅读 · 0 评论