基于关联规则的综合概念描述与变化检测框架
在数据挖掘领域,关联规则挖掘和变化检测是两个重要的研究方向。关联规则挖掘有助于发现数据中的潜在关系,而变化检测则能及时察觉数据分布的改变。下面将详细介绍关联规则的后处理方法以及一个新的变化检测框架。
关联规则后处理方法
关联规则挖掘可以产生大量的规则,但这些规则可能存在冗余,不利于分析和理解。因此,需要对关联规则进行后处理,以得到更简洁、有效的规则表示。
KEX 程序
KEX 程序旨在创建一组分类规则。对于新的示例,所有覆盖该示例的规则都用于计算目标类的组合权重。此外,KEX 还可用于“压缩”关联规则集,得到更简洁的表示。KEX 生成的规则可被视为关联规则的“核心”集,对于使用相同的最小置信度(minconf)、最大前件长度(maxlengthA)和最小支持度(minsup)设置创建的每个关联规则,有以下两种情况:
- 组合权重与关联规则的置信度完全对应(如果该关联规则是核心集的一部分)。
- 组合权重与关联规则的置信度没有显著差异(如果该规则不是核心集的一部分)。
因此,可以使用 KEX 创建的规则集来“查询”所有创建的关联规则的置信度,以描述概念 C。
实验
实验在 UCI 机器学习库的几个基准数据集上进行。数据集的特征(示例数量、属性数量和概念数量)如下表所示:
| 数据集 | 示例数量 | 属性数量 | 概念数量 |
| — | — | — | — |
| Agaricus | 8124 | 22 | 2 |
| Australi | 690 | 14 | 2 |
| Bre
超级会员免费看
订阅专栏 解锁全文
1411

被折叠的 条评论
为什么被折叠?



