步骤:
1、将数组分成块(chunk,一个可以装入内存的小子方)
2、压缩的稀疏数组寻址:(chunk_id,offset)
3、通过访问立方体单元,计算聚集。可以优化访问单元组的次序,使得每个单元被访问的次数最小化,从而减少内存访问和磁盘I\O的开销。
哪个是多路数组聚集的最佳遍历次序?
方法:各平面要按他们大小的升序排列进行排序和计算
思想:将最小的平面放在内存中,对最大的平面每次只是取并计算一块、
这种方法的限制:只有在维数比较小的情况下,效果才比较理想(要计算的立方体随维数指数增加)
如果维数较多,可以考虑使用“自底向上的计算”或者时“冰山方体”计算