多臂老虎机在在线索引选择中的应用:假设索引创建与实际索引创建
1. 引言
在现代数据库管理系统中,索引的选择对于优化查询性能至关重要。传统的索引选择方法依赖于数据库管理员(DBA)和查询优化器,这些方法在静态工作负载中表现良好,但在动态和即兴查询环境中却面临诸多挑战。本文将探讨假设索引创建与实际索引创建之间的对比和影响,重点分析多臂老虎机(MAB)算法和PDTool工具在这两种方法下的表现。
2. 假设索引创建的成本
假设索引创建通常通过“假设分析”(what-if analysis)来完成,这种方法主要用于索引推荐。PDTool(一种索引创建工具)通过这种方式进行索引推荐,推荐时间计入工具的总时间。而MAB(多臂老虎机算法)则是通过实际创建索引来探索。
2.1 推荐时间的差异
假设索引创建的成本主要体现在推荐时间上。PDTool在推荐索引时,通过“假设分析”来评估不同索引配置的效果,而不实际创建索引。这种做法在静态工作负载中较为有效,但在动态环境中,由于工作负载的频繁变化,PDTool的推荐时间会显著增加。例如,在TPC-DS基准测试中,PDTool的调用时间从动态变化设置下的3分钟增加到动态随机设置下的1小时。
2.2 动态变化的影响
在动态变化的工作负载中,PDTool的调用成本随着训练工作负载的增加而显著增长。例如,在TPC-DS基准测试中,当工作负载从25个查询增加到400个查询时,PDTool的调用时间从3分钟增加到1小时。此外,在动态随机和变化设置中,多次调用PDTool进一步加剧了这一问题。表I展示了不同工作负载下PDTool和MAB的时间分解,可以看出PDTool的推荐时
超级会员免费看
订阅专栏 解锁全文
22

被折叠的 条评论
为什么被折叠?



