浅析部分物化以及冰山立方体的计算方法Star-Cubing

本文介绍了部分物化中的冰山立方体概念,解释了如何通过Star-Cubing方法来计算满足特定条件的数据立方体子集。讨论了冰山条件及其在剪枝过程中的应用,并详细阐述了动态星树结构在自底向上聚集过程中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

冰山立方体是部分物化的方体。

这里我们先了解部分物化的概念:有选择地计算整个可能的方体集中一个适当的子集。我们可以计算数据立方体的一个子集,它只包含满足用户指定的某种条件(如每个单元的元组计数大于某个阈值)的那些单元。

举例说明,这句话的意思就是部分物化包含了两种情况,如果我们只计算3-D方体ABC而不计算4-D方体ABCD就属于第一种情况,比如立方体外壳;如果我们只计算方体ABC中的一部分单元则属单元于第二种情况,比如冰山立方体。

如果共享维上的聚集值不满足冰山条件,则沿该维向下的所有单元也不可能满足冰山条件。这样的单元和他们的后代都可以被剪枝。

 

也就是说:如果A维上的某些聚集值a1不满足条件,则沿该维向下的例如AC中a1c1,a1c2,a1c2这些单元都不满足冰山条件被剪枝。其余的a2c1,a2c2,a2c3可能满足而留下。如果共享维的值为a1,并且它不满足冰山条件,则以a1CD/a1为根的整颗子树(包括a1CD/a1C、a1D/a1、a1/a1)都可以被剪枝,因为他们都是a1的更特殊化的版本。

下面是Star-Cubing:使用动态星树结构计算冰山立方体

  • 星树创建:*代替维上不满足冰山条件的属性值

  • 深度优先遍历星树,通过自底向上聚集,在聚集过程中,利用共享维的概念(相当于自顶向下)剪枝。

1.聚集阶段一:处理基本树的最左分支

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值