决策支持环境中关系查询序列的优化
1. 引言
在实际应用中,许多用户的问题无法通过单个 SQL 查询来解决,需要一系列 SQL 查询集合共同协作得出答案。这些查询集合通常会定义一系列视图或临时表,作为问题的部分解决方案,最后再对这些视图或表执行 SQL 查询以获得最终结果。然而,这种情况给传统的优化方法带来了挑战。
我们发现,大量的查询集合遵循一定的模式,并且这些模式所涵盖的查询类别在实际应用中具有重要意义。本文将展示一种高效实现这些查询集合的方法,并通过 TPC - D 基准测试来验证这一方法的有效性。
2. 问题及相关工作
一些常见的业务问题无法用单个 SQL 查询表达,此时可以定义一系列视图或临时表作为部分解决方案,最后再对这些视图或表进行查询以得到最终结果,即逐步构建最终结果。
例如,假设有一个关系 R,包含属性 A、B、C、D。问题“给出与给定 B 相关联的 C 的最小最大值”可以通过以下步骤解决:
首先创建视图:
CREATE VIEW V(B, MYMAX)
AS SELECT B, max(C)
FROM R
GROUP BY B;
然后查询视图:
SELECT *
FROM V
WHERE MYMAX = (SELECT min(MYMAX) FROM V);
从整个查询序列来看,单独计算视图 V 所做的额外工作并非必要。问题在于 SQL 不允许聚合函数的组合,因为每个聚合函数都与 G
超级会员免费看
订阅专栏 解锁全文
2489

被折叠的 条评论
为什么被折叠?



