12、高效挖掘稀有关联规则的方法

高效挖掘稀有关联规则的方法

在数据挖掘领域,挖掘稀有关联规则是一项具有挑战性的任务。传统的基于单一最小支持度(minsup)的频繁模式挖掘方法,如Apriori和FP - growth,存在“稀有项问题”。当最小支持度设置较高时,包含稀有项的频繁模式会被遗漏;而当最小支持度设置较低时,频繁模式的数量会急剧增加。为了解决这个问题,人们提出了“多最小支持度框架”,下面我们来详细了解其中的不同模型。

相关工作

在多最小支持度框架下,主要有以下几种模型:
1. 最小约束模型 :该模型为每个项目指定一个支持约束,即最小项目支持度(MIS)。模式的最小支持度由其所有项目中的最小MIS值表示。使用此框架挖掘的频繁模式不满足向下闭合属性,而是满足排序闭合属性。基于此模型的Apriori类或FP - growth类方法在生成更高阶的频繁模式时,需要同时考虑频繁和非频繁模式。
2. 最大约束模型 :在最小约束模型中,一个模式只要满足其所有项目中的最低MIS值就可以是频繁的。但在某些情况下,用户指定的MIS值意味着任何涉及该项目的模式的支持度不应低于其MIS值。因此,最大约束模型被提出,在该模型中,一个模式只有在满足其所有项目的MIS值时才是频繁的。不过,目前该模型只有类似Apriori的方法,存在性能问题,且现有的基于最小约束模型的FP - growth类方法不能扩展到最大约束模型。
3. 其他模型 :有方法只考虑支持度低于最小支持度的非频繁项来挖掘关联规则,但这种方法无法发现频繁项和稀有项之间的关联。还有一种类似Apriori的方法,试图在每次迭代中使用不同的最小支持度,但仍

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值