目录
1、为什么要优化
(1)kylin主要通过空间换时间的方式来提高查询性能,但是如果cube的所有子cube(2的n次方-1 个)都构建出来,会占用很多计算和存储资源,并且很多子cube的数据根本就不会被查询到,所以要根据查询需求减少不必要的子cube的构建。
(2)如果某个cube组合为A(基数3)、B(基数5)、C(基数1200000)构建ABC组合时,产生的数据量是3*5*1200000,所以要根据业务需求尽量减少高基维度在子cube中出现的次数。
(3)kylin默认选择的存储引擎是Hbase,所以rowKey的设计与Hbase的查询效率密切相关。