将相互之间具有独立决策能力的分类器联合起来的方式就叫作集成分类器。事实证明通常情况下集成分类器的预测能力要比单个分类器的预测能力好得多。集成分类器就好比百万富翁节目里的“
问现场观众”选项,而单个分类器就是
“打电话问老友”。单个人的判断能力在很多情况下是无法跟集体的智慧抗衡的,所以对于同样一个问题,“问现场观众”会比“打电话问老友”把握性大得多(除非你的这位老友真的是爱因斯坦级别的人了,呵呵)。
假设现在有21个分类器,每个分类器的错误率是0.3,我们通过集成这些分类器能得到更好的结果吗?首先,我们用最简单的方式去集成这些分类器的预测结果-“投票”,比如说我们总是选择超过一半分类器预测的结果作为最终预测结果,在这里就是选出有大于或等于11的预测结果作为最终预测结果。很显然,如果用其中的某个分类器去做预测的话,错误率就是0.3了,如果用集成的方法,那么错误率就是:

集成分类器通过组合多个分类器的预测,通常能获得比单个分类器更优的性能。文章通过实例展示了集成分类器如何降低错误率,解释了在数据量小、存在局部最优和假设空间有限的情况下,集成方法为何有效。并推荐了一篇关于集成方法的机器学习论文。
最低0.47元/天 解锁文章

1465

被折叠的 条评论
为什么被折叠?



