Annotated Lucene(源码剖析中文版)
Apache Lucene是一个高性能(high-performance)的全能的全文检索(full-featured text search engine)的搜索引擎框架库,完全(entirely)使用Java开发。它是一种技术(technology),适合于(suitable for)几乎(nearly)任何一种需要全文检索(full-text search)的应用,特别是跨平台(cross-platform)的应用。
- Annotated Lucene:第一节 Lucene是什么
- Annotated Lucene:第二节 索引文件概述
- Annotated Lucene:第三节 索引文件结构(1) - 每个Index包含的文件
- Annotated Lucene:第三节 索引文件结构(2) - 每个Segment包含的文件
- Annotated Lucene:第三节 索引文件结构(3) - Field数据(.fdx和.fdt)
- Annotated Lucene:第三节 索引文件结构(4) - Term字典(.tii和.tis)
- Annotated Lucene:第三节 索引文件结构(5) - Term频率数据(.frq)
- Annotated Lucene:第三节 索引文件结构(6) - Positions位置信息数据(.prx)
- Annotated Lucene:第三节 索引文件结构(7) - Term向量文件
- Annotated Lucene:第三节 索引文件结构(8) - 删除的文档 (.del)
- Annotated Lucene:第四节 索引是如何创建的
- Annotated Lucene:第四节 索引创建过程(1)
- Annotated Lucene:第四节 索引创建过程(2)
- Annotated Lucene:第五节 索引是如何存储的
- Annotated Lucene:第六节 文档内容是如何分析的
- Annotated Lucene:第七节 如何给文档评分
Apache Lucene是一款用Java实现的高性能全文检索引擎库,适用于几乎所有需要全文搜索的应用场景,尤其适用于跨平台应用。本文详细剖析了Lucene的内部工作原理,包括索引文件结构、索引创建与存储过程及文档内容分析等。
136

被折叠的 条评论
为什么被折叠?



