高效执行范围聚合查询与OLAP安全概念建模
在数据仓库环境中,范围聚合查询是一项耗时的处理任务,同时随着数据仓库潜在用户范围的不断扩大,OLAP系统的安全问题也日益凸显。本文将介绍范围聚合查询的高效执行方法以及OLAP安全的概念建模。
范围聚合查询的高效执行
范围聚合查询的执行规则
当请求包含最小边界矩形(MBR)M1a的范围聚合查询时,若父MBR M1完全包含在查询范围内,则使用反映子MBR M1a聚合值的M1聚合值执行查询;若父MBR M1仅与查询范围重叠,则通过子MBR M1a的聚合值执行查询。
聚合值的确定
聚合立方体树中与MBR一起存储的聚合值由用于构成数据立方体的聚合函数决定:
- 对于COUNT、SUM、MIN和MAX函数,聚合值是每个函数的结果。
- 对于AVG函数,同时使用COUNT和SUM值。
- 若数据立方体使用多个聚合函数,则聚合值由所有合适聚合函数的每个值组成。例如,若数据立方体使用SUM和MAX函数构建,则每个MBR中的聚合值存储该MBR的SUM和MAX值。
实验设置
为了研究范围聚合查询的执行效率,进行了一系列实验:
- 数据 :使用2维到5维的合成数据,大小分别为10,000、100,000和1,000,000,数据集遵循均匀分布和Zipf分布。
- 树节点 :树节点大小为4KB,节点中的最大记录数取决于树的维度。2维数据节点的最大记录数为340,5维数据为169。
- 实验环境 :使用
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



