高效通用关联规则分类器方法解析
在数据挖掘领域,分类器的构建和优化一直是研究的重点。本文将介绍一种基于通用关联规则的分类器方法,它旨在解决当前关联分类方法中规则数量过多的问题,同时提高分类的准确性。
1. 相关定义
首先,我们来了解一些关键定义。设 FCIK 为频繁闭项集的集合,Gf 为包含于或等于闭频繁项集 f 的所有频繁项集的最小生成器集合。IGB 定义如下:
IGB = {R: gs ⇒(f1 - gs) | f, f1 ∈FCIK 且 (f - gs) ≠ ∅ 且 gs ∈Gf 且 f1 ⪯f 且 confidence(R) ≥minconf 且不存在 g′ ⊂gs 使得 confidence(g′ ⇒ f1 - g′)≥minconf}
IGB 的通用规则呈现了可能的最小前提和最大结论之间的蕴含关系,这一特性在后续的分类方法中十分重要。
2. Garc 分类器方法
Garc 是一种基于通用关联规则的分类器方法,它直接从关联规则的通用基中提取通用分类规则,以克服当前关联分类方法生成大量关联分类规则的缺点。
2.1 规则生成
规则生成步骤如下:
1. 提取关联规则的通用基。
2. 过滤通用规则,仅保留结论包含类标签的规则。
3. 应用分解公理,得到形如 A1, A2, …, An ⇒ci 的新规则。
虽然得到的规则可能存在冗余,但它们的生成对于保证必要规则的最大覆盖是必需的。例如,考虑规则 R1: A B C D ⇒cl1 和 R2: B C ⇒cl1,R2 具有更小的前提,在分类时能匹配更多对象,体现了通用规则的优势。
超级会员免费看
订阅专栏 解锁全文
2265

被折叠的 条评论
为什么被折叠?



