多维空间中梯度排序的探索与实践
在当今数字化时代,商业组织的数据仓库中数据量与日俱增。从这些多维数据库中获取有价值的信息并非易事。多维数据分析(MDA)在商业应用中具有重要意义,但随着探索维度的增加,计算成本也显著提高。为了使MDA在实际业务问题中更具实用性,研究人员致力于将数据立方体和挖掘技术相结合,以检测多维空间(MDS)中的有趣变化,梯度查询也可用于检测此类变化。然而,目前很少有研究关注MDS中的偏好查询选择,因此,对最有趣的梯度进行排序显得尤为重要。
相关工作回顾
- 梯度问题的提出 :MDS中复杂度量变化的挖掘问题最早由Imielinski在2002年提出,即立方体梯度问题,旨在探索一组感兴趣的度量(聚合)的变化与底层扇区(维度)特征变化之间的关联。
- 现有方法的局限性 :Dong在2004年提出了LiveSet - Driven方法,提高了挖掘梯度单元的效率。此外,还有其他研究致力于在数据立方体中挖掘有趣的单元,但这些方法的“有趣性”概念与基于梯度的方法不同。现有方法采用统计或基于比率的方法来支持“有趣性”,但仍会产生大量需要评估的有趣案例。在实际应用中,人们通常只对少量(Top - K单元)的梯度单元感兴趣。虽然已有许多关于在大型数据库中回答Top - K查询的研究,但由于立方体梯度模型提供的复杂非凸函数,传统的Top - K查询方法难以直接应用。
梯度查询解析
梯度查询(或立方体梯度)本质上是一种立方体语句,可解释为关于所选聚合如何受各种立方体修改影响的“假设”公式,也可视为关联规则(多维关联规则)的推广。可能的立方体操
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



