索引(Index)视为一种模型(Model):
- B-Tree索引B-Tree索引模型将一个Key映射到一个排序数组中的某位置所对应的记录
- Hash索引Hash索引模型将一个Key映射到一个无序数组中的某位置所对应的记录
- Bitmap索引Bitmap索引模型用来判断一条记录是否存在
Learned Index是一种利用机器学习优化传统数据库索引的技术,通过掌握数据分布特性,改进B-Tree Index,实现更快的查询速度和更高的存储效率。在测试中,相对于B-Tree,Learned Index的RM-Index模型性能提升60%~70%,存储空间节省高达99%。这种递归模型考虑了全局数据分布,并通过有限步迭代定位数据,降低了错误率。
这篇论文在两个月前刚被公布出来的时候,因为带着Jeff Dean的署名曾一度被热传,但直到今天才认真读完这篇论文。Learned Index基于机器学习的方法,对传统数据库索引做了改造。本文先介绍Learned Index的RM-Index模型以及与B-Tree索引的对比。
索引(Index)视为一种模型(Model):

被折叠的 条评论
为什么被折叠?