多臂老虎机在在线索引选择中的应用与优势
1. 引言
在现代数据库管理系统(DBMS)中,物理设计调优尤其是索引选择,对于提高查询性能至关重要。尽管已有许多商业工具提供索引建议,但这些工具通常依赖于静态工作负载和查询优化器的成本模型,这在动态和不可预测的工作负载中表现不佳。本文介绍了一种基于多臂老虎机(MAB)的学习框架,用于在线索引选择。该框架通过探索和观察实际性能,学习索引的好处,从而避免了对数据库管理员(DBA)和查询优化器的依赖。实验结果表明,MAB在多种工作负载下表现出色,尤其在数据倾斜和即兴查询场景中具有显著优势。
2. 多臂老虎机学习框架
2.1 框架概述
多臂老虎机(MAB)是一种统计机器学习方法,特别适用于不确定环境中的序列决策问题。在在线索引选择中,MAB将不同索引视为不同的“臂”,并通过选择和观察这些臂的实际性能来优化索引配置。具体而言,MAB框架包含以下几个关键步骤:
- 初始化 :设置初始参数,如超参数 (\lambda) 和 (\alpha)。
- 观测 :获取当前工作负载的特征向量和上下文信息。
- 选择 :基于上下文信息,选择一组索引(即“臂”)。
- 执行 :创建选定的索引并执行查询,记录实际性能。
- 更新 :根据执行结果更新模型参数,为下一轮选择做准备。
超级会员免费看
订阅专栏 解锁全文
43

被折叠的 条评论
为什么被折叠?



