元分类器的规则验证
在数据挖掘领域,元分类器的规则验证是提升分类性能和效率的关键环节。本文将深入探讨元分类器规则验证的相关技术和实验结果。
规则编码与处理
概念中的规则通过编号进行编码,由于每个规则的覆盖范围已在格中计算并存储,所以处理速度极快,且能迅速获取规则的结论。
样本作为测试集验证规则
验证过程的核心思想是:经过过滤的规则具有较高的置信系数,在处理新对象时应展现出良好的预测准确性。因此,在新测试集上评估这些规则时,可忽略不符合预期的规则。
具体操作如下:
1. 使用样本集 S 作为测试集。
2. 为规则集 Rt 中的每个规则计算新的错误率 ESr(S)。
3. 忽略错误率 ESr(S) 大于阈值 tS 的规则。
4. 生成的元分类器为规则集 RSt,公式如下:
[
R_{S_t} = { r_{ik} \in R_t | E_{S_{r_{ik}}}(S) \leq t_S }
]
实验设置
为评估元学习方法的性能,进行了一系列实验,包括:
1. 寻找生成元分类器 Rt 的最佳阈值 t。
2. 寻找生成 RGt 的最佳参数对 (t, Costfunction)。
3. 寻找生成 RSt 的最佳参数对 (t, tS)。
4. 比较 R、Rt、RGt 和 RSt 与 R′ 的预测准确率。
5. 比较 R、Rt、RGt 和 RSt 与 R′ 的规则集大小。
实验使用了来自 UCI 存储库的十个数据集,包括 adult、chess end-game 等。为
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



