模糊关联规则挖掘

模糊关联规则挖掘方法解析
本文介绍了模糊关联规则挖掘,作为一种处理连续值记录的算法,它避免了硬边界划分的问题。通过FCM算法对连续属性进行模糊集划分,并计算significance factor和certainty factor来挖掘关联规则。模糊关联规则的应用有助于更准确地分析数据,如年龄与薪水的模糊分类关系。

 模糊关联规则挖掘

  关联规则挖掘是数据挖掘最基本和最常用的算法之一,Apriori算法基本上是每个学习数据挖掘的同学掌握的第一个算法。但是,一般的关联规则挖掘算法无法处理涉及连续值的记录。  虽然某些算法把连续值通过划分区间的方法离散化,但是这种硬边界划分的方法效果并不是很好,一些在边缘附近的数据只能属于一个划分,而这与事实不符。比如,年龄的一个划分可以是青年,但如果我们把青年的区间定义为[20,30],则19岁的人就被排除在青年的范围之外了,显然这不是很合适。针对这种问题,我们可以基于模糊集把区间划分成多个模糊集,然后求得某个元素属于某个模糊集的概率(根据模糊隶属函数),这样的话每个元素都可以属于多个不同的模糊集,而不是只属于一个集合。划分模糊集的常用算法是FCM,见参考文献。

  当我们给定了所有连续值属性的模糊集划分之后,下一步就是进行关联规则的挖掘了,我们定义问题如下:

  T={t1,t2,...,tn}是数据集

  I={i1,i2,...,im}是属性集,我们假定所有的属性都是数值型。

  Fik={fik1,fik2,...,fikl}代表第ik个属性的模糊集。

  我们要挖掘的模糊关联规则的形式为:

   If X is A then Y is B.

  其中,X和Y是属性,A和B是X,Y对应的模糊集中的某个划分,比如:

&n

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值