机器学习基石之多分类（Multi-Classification）

最新推荐文章于 2025-10-06 10:40:47 发布

原创最新推荐文章于 2025-10-06 10:40:47 发布 · 1.1k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习

机器学习同时被 2 个专栏收录

32 篇文章

订阅专栏

机器学习基石

8 篇文章

订阅专栏

本文深入探讨了多分类问题中的两种核心策略：One-Versus-All(OVA)和One-Versus-One(OVO)分解方法。OVA通过将每个类别与其他所有类别进行对比，创建多个二分类模型；而OVO则通过比较每对类别，建立更大量的二分类器。文章详细解析了两种方法的实现过程，以及各自的优缺点。

多分类（Multi-Classification）

One-Versus-All (OVA) Decomposition

以逻辑回归为例，其思路是将其中一类和剩下的类分开，做二分类，并对全部类做次操作，这样便有了K个逻辑回归分类器，只要取其中概率最大hypothesis所对应的分类作为分类结果即可。

for $\in \mathcal { Y }$ , obtain $w[k]\mathbf{w}_{[k]}$ by running logistic regression on
$\mathcal { D } _ { [ k ] } = \left\{ \left( \mathbf { x } _ { n } , y _ { n } ^ { \prime } = 2 \left[\kern-0.15em\left[ y _ { n } = k \right]\kern-0.15em\right] - 1 \right) \right\} _ { n = 1 } ^ { N }$
return $\mathbf { x } ) = \operatorname { argmax } _ { k \in \mathcal { Y } } \left( \mathbf { w } _ { [ k ] } ^ { T } \mathbf { x } \right)$

其优缺点是：

pros: efficient ，can be coupled with any logistic regression-like approaches
效率高，可以和类似逻辑回归的算法（输出概率的算法）结合
cons: often unbalanced D[k] when K large
如果K太大会导致数据不平衡

One-Versus-One (OVO) Decomposition

其基本思路是将其中一类和剩下的类中的一类做二分类，然对全部分类器执行该操作（组合数就是分类器数），那么

for $\ell ) \in \mathcal { Y } \times \mathcal { Y }$ , obtain $w[k,l]\mathbf { w }_ { [ k , l ] }$ by running logistic regression on

$\mathcal { D } _ { [ k , \ell ] } = \left\{ \left( \mathbf { x } _ { n } , y _ { n } ^ { \prime } = 2 \left[\kern-0.15em\left[ y _ { n } = k \right]\kern-0.15em\right] - 1 \right) : y _ { n } = k \text { or } y _ { n } = \ell \right\}$

return $\mathbf { x } ) = \text { tournament champion } \left\{ \mathbf { w } _ { [ k , \ell ] } ^ { T } \mathbf { x } \right\}$

其优缺点是：

pros: efficient (‘smaller’ training problems), stable, can be coupled with any binary classification approaches
更有效率更加稳定，可以结合任何二分类方法
cons: use $w[k,l]O(K^2) \,\mathbf { w }_ { [ k , l ] }$ ，more space, slower prediction, more training。
需要训练 $O(K^2)$ 个 $,w[k,l],\mathbf { w }_ { [ k , l ] }$ ，占用更多的时间和空间。