数据分析查询的确定性视图选择:方法与策略
在数据分析查询中,视图选择是一个关键问题,它直接影响到查询的性能和效率。本文将深入探讨视图选择问题的相关概念、方法和实验结果。
1. 成本效益比与视图选择
- 成本效益比的含义 :成本效益比 (r(v, Q’)) 反映了物化视图 (v) 相对于查询子集 (Q’) 的成本与效益关系。如果该比值相对较大,意味着物化视图 (v) 可能带来的“效益”不多,但会产生大量的“额外成本”,因此在这种情况下,视图 (v) 不太适合被物化。
- 最小成本效益比的定义 :视图 (v) 相对于查询集 (Q) 的最小成本效益比 (r_{min}(v, Q)) 定义为 (Q(v)) 所有正子集的成本效益比中的最小值,公式如下:
[r_{min}(v, Q) = \min_{Q’ \in PS(Q(v))} r(v, Q’) = \min_{Q’ \in PS(Q(v))} \frac{\sum_{q \in Q’} (S(v) - S(q))}{\sum_{q \in Q’} S(q) - S(v)}]
其中,(PS(Q(v))) 表示 (Q(v)) 的所有正子集的集合,(S(v)) 和 (S(q)) 分别表示视图 (v) 和查询 (q) 的存储大小。 - 最小成本效益比的性质 :对于给定的查询集 (Q) 和视图集 (V),每个视图 (v \in V) 的最小成本效益比 (r_{min}(v, Q)) 存在且 (r_{min}(v, Q) \geq 0)。
- 计算
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



