模糊关联规则挖掘

模糊关联规则挖掘方法解析

最新推荐文章于 2025-04-03 12:00:44 发布

转载

最新推荐文章于 2025-04-03 12:00:44 发布 · 1.4k 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/kemaswill/archive/2012/11/05/2755826.html

文章标签：

#matlab #人工智能

本文介绍了模糊关联规则挖掘，作为一种处理连续值记录的算法，它避免了硬边界划分的问题。通过FCM算法对连续属性进行模糊集划分，并计算significance factor和certainty factor来挖掘关联规则。模糊关联规则的应用有助于更准确地分析数据，如年龄与薪水的模糊分类关系。

模糊关联规则挖掘

关联规则挖掘是数据挖掘最基本和最常用的算法之一，Apriori算法基本上是每个学习数据挖掘的同学掌握的第一个算法。但是，一般的关联规则挖掘算法无法处理涉及连续值的记录。虽然某些算法把连续值通过划分区间的方法离散化，但是这种硬边界划分的方法效果并不是很好，一些在边缘附近的数据只能属于一个划分，而这与事实不符。比如，年龄的一个划分可以是青年，但如果我们把青年的区间定义为[20，30]，则19岁的人就被排除在青年的范围之外了，显然这不是很合适。针对这种问题，我们可以基于模糊集把区间划分成多个模糊集，然后求得某个元素属于某个模糊集的概率（根据模糊隶属函数），这样的话每个元素都可以属于多个不同的模糊集，而不是只属于一个集合。划分模糊集的常用算法是FCM，见参考文献。

当我们给定了所有连续值属性的模糊集划分之后，下一步就是进行关联规则的挖掘了，我们定义问题如下：

T={t₁,t₂,...,t_n}是数据集

I={i₁,i₂,...,i_m}是属性集，我们假定所有的属性都是数值型。

F_ik={f_ik¹,f_ik²,...,f_ik^l}代表第ik个属性的模糊集。

我们要挖掘的模糊关联规则的形式为：

If X is A then Y is B.

其中，X和Y是属性，A和B是X，Y对应的模糊集中的某个划分，比如：

&n

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。