探索多臂老虎机在数据库索引优化中的应用
1. 引言
随着数据库应用的日益复杂和多样化,特别是在多租户云环境中,自动化物理设计调优,尤其是自动化索引选择,已成为数据库管理系统中的一个关键挑战。传统的方法通常依赖于数据库管理员(DBA)提供的代表性训练工作负载,这种方法不仅费时费力,而且在动态环境中效果不佳。本文将探讨一种基于多臂老虎机(MAB)的学习框架,该框架能够在不确定的工作负载下实现高效的在线索引选择,从而显著提升数据库性能。
2. 摘要
自动化物理数据库设计一直是数据库研究领域的长期关注点,因为优化后的结构能够带来显著的性能提升。尽管取得了重大进展,但当今大多数商业解决方案仍然高度依赖手工操作,需要数据库管理员(DBA)在离线状态下调用,并期望他们能够识别并提供代表性的训练工作负载。即便是最新的技术进展,如查询存储,也只能为动态环境提供有限的支持。本文提出了一种自动驾驶的在线索引选择方法,该方法摒弃了数据库管理员(DBA)和查询优化器,而是通过战略探索和直接性能观察来利用可行结构的好处。我们将这个问题视为不确定性下的序列决策问题,具体来说是在多臂老虎机学习环境中。多臂老虎机通过平衡探索和利用来确保平均性能收敛到具有完美后见之明的最优策略。我们的简化老虎机框架在收敛速度和性能波动方面优于深度强化学习(RL)。全面的实证结果表明,与最先进的商业调优工具相比,在变化和临时工作负载上可以实现高达75%的速度提升,在静态工作负载上可以实现28%的速度提升;与深度RL替代方案相比,可以实现高达58%的速度提升。
3. 问题表述
3.1 问题定义
在线数据库索引选择的目标是选择一组索引(称为配置),在给定的内存预算内最小化工作负载序列的
超级会员免费看
订阅专栏 解锁全文

27

被折叠的 条评论
为什么被折叠?



