Lucene 全文磁力搜索
数据区(Field域document文档) + 索引区(分词后的词条)
数据存:
- 创建文档源对象,确定存储的磁盘路径
- 将文档源对象按照属性字段存入 数据区
- 文档中的值按照一定的分词策略存入 索引区
- 一次文档的存储,会在数据区给这个文档生成一个docId,该文档下有多个属性字段
数据查:
- 采用与存相同的分词器
- 按照条件检索 索引区 的词条
- 根据检索后的词条,查询 数据区 对应的文档,并为匹配上的文档打分(匹配度)
- 返回一个docId的数组
- 根据docId查询数据区的属性字段
博客介绍了Lucene全文磁力搜索,包括数据存储和查询。存储时,创建文档源对象,确定磁盘路径,将文档按属性字段存入数据区,值按分词策略存入索引区,会生成docId。查询时,用相同分词器,检索索引区词条,查数据区文档并打分,返回docId数组再查属性字段。
775

被折叠的 条评论
为什么被折叠?



