12、多维空间中梯度排序的探索与实践

多维空间中梯度排序的探索与实践

在当今数字化时代,商业组织的数据仓库中数据量与日俱增。从这些多维数据库中获取有价值的信息并非易事。多维数据分析(MDA)在商业应用中具有重要意义,但随着探索维度的增加,计算成本也显著提高。为了使MDA在实际业务问题中更具实用性,研究人员致力于将数据立方体和挖掘技术相结合,以检测多维空间(MDS)中的有趣变化,梯度查询也可用于检测此类变化。然而,目前很少有研究关注MDS中的偏好查询选择,因此,对最有趣的梯度进行排序显得尤为重要。

相关工作回顾
  • 梯度问题的提出 :MDS中复杂度量变化的挖掘问题最早由Imielinski在2002年提出,即立方体梯度问题,旨在探索一组感兴趣的度量(聚合)的变化与底层扇区(维度)特征变化之间的关联。
  • 现有方法的局限性 :Dong在2004年提出了LiveSet - Driven方法,提高了挖掘梯度单元的效率。此外,还有其他研究致力于在数据立方体中挖掘有趣的单元,但这些方法的“有趣性”概念与基于梯度的方法不同。现有方法采用统计或基于比率的方法来支持“有趣性”,但仍会产生大量需要评估的有趣案例。在实际应用中,人们通常只对少量(Top - K单元)的梯度单元感兴趣。虽然已有许多关于在大型数据库中回答Top - K查询的研究,但由于立方体梯度模型提供的复杂非凸函数,传统的Top - K查询方法难以直接应用。
梯度查询解析

梯度查询(或立方体梯度)本质上是一种立方体语句,可解释为关于所选聚合如何受各种立方体修改影响的“假设”公式,也可视为关联规则(多维关联规则)的推广。可能的立方体操

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值