4、正负关联规则挖掘:受限规则的方法

正负关联规则挖掘:受限规则的方法

1. 引言

关联规则挖掘是数据挖掘中的一项重要任务,旨在发现事务数据库中项目之间的关系。它在推荐系统、诊断决策支持、电信、入侵检测等众多应用领域都有广泛的用途。传统的关联规则挖掘算法主要关注正关联规则,即事务中存在的项目之间的关联。然而,负关联规则,即考虑项目缺失情况的关联规则,也能提供有价值的信息。

例如,在市场篮子分析中,“购买可乐的顾客不购买百事可乐”这样的负关联规则可以帮助商家制定营销策略。但由于发现负关联规则的过程较为复杂,目前相关的研究和算法相对较少。

1.1 本文贡献

  • 新算法 :设计了一种新的算法,用于生成正关联规则和负关联规则。该算法使用不同的兴趣度度量,并从不同的候选集生成关联规则。
  • 自动阈值 :引入了相关系数的自动阈值调整机制,避免了手动调整参数的困难。通过逐步滑动阈值,找到强相关性的规则。
  • 性能比较 :将该算法与其他现有的负关联规则挖掘算法进行比较,并讨论了它们的性能。

2. 基本概念和术语

2.1 关联规则

形式上,关联规则定义如下:设 $I$ 是一个项目集,$T$ 是一个事务集,每个事务 $T$ 是 $I$ 的一个子集,且每个事务都有一个唯一的标识符 $TID$。如果事务 $T$ 包含项目集 $X$,则称 $T$ 包含 $X$。关联规则是形如 $X \Rightarrow Y$ 的蕴含式,其中 $X, Y \subseteq I$ 且 $X \

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值