分类器集成中的多样性应用与分析
1. 线性分类器的分类边界与集成图
在对分类器的研究中,我们以七个线性分类器为例进行分析。这里使用了 2500 个带标签的网格点,分类器编号从 1 到 7,其中“鱼”类的集成分类区域(黑点)被阴影标记。
1.1 集成图的计算
通过非度量多维缩放,利用分歧度量 D 计算出集成图。在计算分歧矩阵之前,我们在矩阵中添加了两列,分别是各个分类器的神谕输出、集成神谕输出,以及一列全为 1 代表能正确识别所有对象的理想分类器。
1.2 分类器关系分析
从图中可以看出,分类器 1 和 3 的边界接近,在集成图中也靠得较近;分类器 2、4 和 7 也有类似情况。与集成最接近的是分类器 1 和 7,它们的边界与集成的边界相差不远。各个分类器的误差(%)分别为:(1) 30.12,(2) 35.96,(3) 33.68,(4) 36.12,(5) 34.16,(6) 33.36,(7) 33.16,而集成误差为 28.40%。在所有单个分类器中,分类器 1 最接近“真实标签”点(理想分类器)。虽然图中与理想分类器的接近程度不能直接与分类误差相关联,但存在较弱的关联。分类器 2 和 4 的单个误差最大,离“真实标签”最远;而分类器 1 和集成的误差最低,离真实标签最近。此外,集成点位于点 1 - 7 之间,表明它与所有集成成员都有关系。具体数据如下表所示:
| 分类器编号 | 误差(%) |
| — | — |
| 1 | 30.12 |
| 2 | 35.96 |
| 3 | 33.68 |
| 4 | 36.12 |
| 5 | 34.16 |
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



