
Lucene
文章平均质量分 88
zhongrui_fzr
公众号:step in 机器学习
github主页:https://zrfan.github.io/
展开
-
Lucene学习笔记(一)-------Lucene基础
Lucene简介获取内容 Lucene作为一个核心搜索库,并不提供任何功能来实现内容获取建立文档 文档主要包括几个带值的域,比如标题(title),正文(body),摘要(abstract),作者(author)和链接(URL) 可以向比较重要的单个的文档或域中插入权值,加权操作可能在索引操作前就静态完成了,也可能要在搜索期间才动态完成。包括Lucene在内的几乎所有搜索引擎都会自动地原创 2017-09-05 08:18:46 · 936 阅读 · 1 评论 -
Lucene学习笔记(二)--------构建索引
构建索引对搜索内容建模文档和域文档是索引和搜索的原子单位,包含一个或多个域的容器,域则依次包含“真正的”被搜索内容。每个域都有一个标识名称(即一个文本值或二进制值)。将文档加入到索引中时,可以通过一系列选项控制Lucene的行为。在对原始数据进行索引操作时,先将数据转换成Lucene所能识别的文档和域,搜索过程中被搜索对象为阈值。Lucene可以针对域进行3种操作:阈值可以被索引(或者不被索引),原创 2017-09-05 08:23:12 · 936 阅读 · 0 评论