基本概念:
基本单元:基本方体的单元
- 聚集单元:非基本方体的单元
- 冰山立方体:部分物化的立方体
- 最小支持度(最小支持度阀值):部分物化的最小阀值(说白了就是限定了一个范围)
∵冰山立方体仍有大量不感兴趣的单元需要计算
∴引入——闭覆盖——一个单元没有后代或者它的后代的度量值与其不同
法2:只预计算涉及少数维的立方体,这些方体形成的数据立方体的立方体外壳
- 计算的一般策略:四种优化技术
1. 排序、散列和分组
2. 同时聚集和缓存中间结果
3. 当存在多个子女方体时,由最小的子女聚集
4. 先验剪枝法
—————————————————————————————————————————————————————————————————————————————
数据立方体的计算方法
- 多路数组聚集
计算以2-D平面为例:
维的大小:A——40;B——400;C——4000
1. 扫描次序为1~64
2. 扫描次序为1,17,33,49,5,21,37,53
特点:
1. &nbs

本文介绍了数据立方体技术在OLAP和数据挖掘中的应用,包括多路数组聚集、BUC算法、星型树结构的计算方法。讨论了数据立方体的优化策略,如排序、散列和分组,以及如何处理冰山立方体和预计算壳片段。此外,还探讨了抽样立方体、排序立方体、预测立方体和多特征立方体等在高级查询和预测分析中的作用。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



