空间数据仓库中视图物化成本优化策略
1. 引言
数据仓库面临的主要挑战之一是在将维护成本降至最低的同时,提高查询响应时间。近年来,在设计数据仓库时,选择性地物化源关系上的某些视图已成为一种理念。物化视图会产生空间成本和视图维护成本,而未物化的视图则会产生即时计算成本。在空间数据仓库(SDW)中,由于空间数据通常较大,且空间操作比传统关系操作更昂贵,这两种成本往往都高得令人望而却步。
为解决这一问题,我们引入了一种名为“预览(preview)”的中间视图,其物化和即时计算成本都显著低于传统视图。预览的核心思想是预处理查询的非空间部分并进行物化,而将空间部分留待即时计算,并维护指向要执行空间操作的空间数据的指针。此外,预览还利用了不同视图之间的层次关系。
2. 空间查询基础概念
- 混合代数 :混合代数由混合关系 (R)、混合运算符 (op) 和混合操作数 (X) 构成,是在空间数据仓库中定义空间查询的基础。在 SDW 中,基关系是包含来自字母数字关系和空间关系的属性和元组的混合关系。
- 空间查询定义 :空间查询是一个混合代数表达式 (F),具体定义如下:
- 单个公式 (f) 可以是一元((op(X1)))、二元((op(X1, X2)))或 (n) 元((op(X1, X2, …Xn))),其中 (op) 是混合代数运算符,每个 (Xi) 是混合操作数。
- 如果 (F1) 是混合代数表达式,则 (F = op(X1, X2, …, Xm, F1)) 也是混合代数表达式。
超级会员免费看
订阅专栏 解锁全文
11

被折叠的 条评论
为什么被折叠?



