从二分类到多分类的迁移策略

最新推荐文章于 2023-04-04 10:24:11 发布

转载最新推荐文章于 2023-04-04 10:24:11 发布 · 1.2k 阅读

·

0

·

机器学习专栏收录该内容

33 篇文章

订阅专栏

本文深入探讨了多分类问题中的一对一、一对其余及多对多三种常见拆分策略，详细解析了每种策略的工作原理及其应用场景，帮助读者理解多分类问题的处理方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一般情况下问题研究为二分类问题，在解决多分类问题时有时可以直接推广到多分类，有时不能，不能推广的时候主要用三种拆分策略对问题进行研究

一对一的策略
给定数据集DD这里有NN个类别，这种情况下就是将这些类别两两配对，从而产生N(N−1)/2个二分类任务，在测试的时候把样本交给这些分类器，然后进行投票

一对其余策略
将每一次的一个类作为正例，其余作为反例，总共训练NN个分类器。测试的时候若仅有一个分类器预测为正的类别则对应的类别标记作为最终分类结果，若有多个分类器预测为正类，则选择置信度最大的类别作为最终分类结果。

多对多分类策略
基于一种纠错输出码的分类策略，分为两个步骤

编码：对NN个类别做MM次划分，每次划分将一部分类别划为正类，一部分划为反类，从而形成一个二分类训练集，这样一共产生MM个训练集，可训练出MM个分类器

**解码**M个分类器分别对测试样本进行预测，这些预测标记组成一个编码。将这个预测编码与每个类别各自的编码进行比较，返回其中距离最小的类别作为最终预测的结果

这里的类别划分通过编码矩阵指定，编码矩阵主要有，二元码（每个类别分别指定正类反类），三元码（正，反，停用）

一般来说编码越长则纠错能力越强，但是意味着所需训练的分类器越多，计算存储的开销越大，不一定得到越好的训练效果，因为跟把样本进行分组也有关系

---------------------
作者：晨凫追风
来源：优快云
原文：https://blog.youkuaiyun.com/hit2015spring/article/details/72902927
版权声明：本文为博主原创文章，转载请附上博文链接！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。