实时数据分析中的性能优化与关联规则挖掘查询优化
在实时数据分析和关联规则挖掘领域,性能优化和查询细化是至关重要的问题。下面将详细介绍相关的实验和方法。
实时 OLAP 中的性能测试
在实时 OLAP 性能测试中,测试场景包含 100 个电机,对每个电机的功率进行测量。测量值假定具有随机游走行为,且每个电机独立处理。
电机基于四个维度(类型、功率范围、制造年份和机器部件)进行分析,使用的聚合格包含 16 个表,且这些表均已物化。实验分别针对两个聚合函数 AVG(power) 和 SUM(power) 进行,这两个函数分别代表分布式和代数聚合函数组。实验中不涉及整体聚合函数。每个电机测量值的到达率为 1/s,容差在 2% 到 20% 的范围内变化。
在测试运行期间,测量格重新计算的次数。当更新的误差带超过给定容差时,进行格重新计算。结果以格重新计算百分比表示,计算公式如下:
[
RECALC\% = \frac{no. of lattice element recalculations * 2}{no. of input transactions}
]
测试在装有 Windows NT 4 的 333 MHz Pentium Pro PC 上进行,主内存为 128Mb。实验结果如图 1 所示:
| 容差 | 重新计算百分比(Avg()) | 重新计算百分比(Sum()) |
|---|---|---|
| 2% |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



