机器学习:线性模型-多分类任务拆分之纠错输出码ECOC浅析

本文探讨了多分类任务转化为二分类任务的三种常见方法:一对一(OvO)、一对其余(OvR)和多对多(MvM),并详细解析了每种方法的工作原理及其优缺点。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我的小程序:

待办计划:在不确定中前行
随笔日记:祭那些逝去的时光

多分类任务通常转化为多个二分类任务,再对预测结果进行集成得出最终分类结果。

拆分为二分类任务通常有3种:一对一(OvO),一对其余(OvR)和多对多(MvM)。

OvO:

将N个类别两两配对,共N(N-1)/2个分类任务,每个分类任务一个类别作为正例,另一个作为反例,学习得到N(N-1)/2个分类器。新样本同时提交给所有分类器,得到N(N-1)/2个分类结果,把预测最多的类别作为最终结果。见下图:

OvR:

每次将一个类作为正例,其余所有类作为反例,训练N个分类器。新样本提交给所有分类器,若仅有一个分类器预测为正例,则该类标记作为最终结果,如上图。若有多个分类器标记为正例,则考虑预测置信度。

注:类别很多时,OvO的训练时间开销通常比OvR小(OvR每个分类器都使用全部样本)

MvM:

每次将若干个类别作为正例,其他作为反例,最常用“纠错错误码(ECOC)”,(ECOC编码对分类器错误有一定的容忍修正能力,即使某个分类器预测出错,也不一定会影响结果)

ECOC:

编码:将N个类别做M次划分,每次将一部分作为正例,其余作为反例,学习到M个分类器;

解码:新样本提交给M个分类器,得到M个结果,组成一个编码,将其和每个类别各自的编码进行比较,距离最小的类别作为最终结果。如下图:

图a中测试样例的编码和C3类的编码欧式距离最小,所以测试样本最终判定结果为C3类(采用欧式距离判别)

待办计划:在不确定中前行
随笔日记:祭那些逝去的时光

参考资料:周志华《机器学习》

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值