多维聚合可推导性与数据真实维度提取
在多维数据处理领域,多维聚合的可推导性以及数据真实维度的提取是至关重要的问题。它们对于提高查询效率、优化数据存储和挖掘数据潜在信息都有着重要的意义。
多维聚合可推导性
多维聚合的可推导性判断是多维查询优化器的核心任务。为了确定多维对象是否可推导,需要检查三个条件:度量兼容性、粒度兼容性以及范围包含性。
范围归一化
在处理范围包含性问题时,我们引入了范围归一化的概念。首先,定义了紧凑范围:
- 紧凑范围定义 :一个范围 S 是紧凑的,当且仅当 S 是正项的合取,并且不存在两个不同的项 Di.Dj=c 和 Di.Dk=c’,其中 c 是 c’的祖先。例如,((P.Family=’Camcorder’∨P.Family=’HomeVCR’)^L.Country=’Germany’) 不是紧凑范围,而 (P.Group=’Video’^L.Country=’Germany’) 是紧凑范围。
- 范围包含关系 :一个紧凑范围 S 包含于范围 S’(表示为 S→S’ 或 S⊆S’),当且仅当对于 S’ 中的每个项 Di.Dk=c’,在 S 中都存在一个项 Di.Dj=c,使得 c’ 是 c 的祖先。例如,(P.Family=’HomeVCR’) /⊆(P.Group=’Video’^L.Country=’Germany’),但 (P.Family=’HomeVCR’ ^L.Country=’Germany’)⊆(P.Group=’Video’)。
通过确定合取子句中类的祖先/后代关系,可以解决范围包含、交集和差集的问题
超级会员免费看
订阅专栏 解锁全文
1259

被折叠的 条评论
为什么被折叠?



