多分类(Multi-Classification)
One-Versus-All (OVA) Decomposition
以逻辑回归为例,其思路是将其中一类和剩下的类分开,做二分类,并对全部类做次操作,这样便有了K个逻辑回归分类器,只要取其中概率最大hypothesis所对应的分类作为分类结果即可。
-
for k∈Yk \in \mathcal { Y }k∈Y , obtain w[k]\mathbf{w}_{[k]}w[k] by running logistic regression on
D[k]={(xn,yn′=2[[yn=k]]−1)}n=1N \mathcal { D } _ { [ k ] } = \left\{ \left( \mathbf { x } _ { n } , y _ { n } ^ { \prime } = 2 \left[\kern-0.15em\left[ y _ { n } = k \right]\kern-0.15em\right] - 1 \right) \right\} _ { n = 1 } ^ { N } D[k]={(xn,yn′=2[[yn=k]]−1)}n=1N -
return g(x)=argmaxk∈Y(w[k]Tx)g ( \mathbf { x } ) = \operatorname { argmax } _ { k \in \mathcal { Y } } \left( \mathbf { w } _ { [ k ] } ^ { T } \mathbf { x } \right)g(x)=argmaxk∈Y(w[k]Tx)
其优缺点是:
- pros: efficient ,can be coupled with any logistic regression-like approaches
效率高,可以和类似逻辑回归的算法(输出概率的算法)结合 - cons: often unbalanced D[k] when K large
如果K太大会导致数据不平衡
One-Versus-One (OVO) Decomposition
其基本思路是将其中一类和剩下的类中的一类做二分类,然对全部分类器执行该操作(组合数就是分类器数),那么
- for (k,ℓ)∈Y×Y( k , \ell ) \in \mathcal { Y } \times \mathcal { Y }(k,ℓ)∈Y×Y , obtain w[k,l]\mathbf { w }_ { [ k , l ] }w[k,l] by running logistic regression on
D[k,ℓ]={(xn,yn′=2[[yn=k]]−1):yn=k or yn=ℓ} \mathcal { D } _ { [ k , \ell ] } = \left\{ \left( \mathbf { x } _ { n } , y _ { n } ^ { \prime } = 2 \left[\kern-0.15em\left[ y _ { n } = k \right]\kern-0.15em\right] - 1 \right) : y _ { n } = k \text { or } y _ { n } = \ell \right\} D[k,ℓ]={(xn,yn′=2[[yn=k]]−1):yn=k or yn=ℓ}
- return g(x)= tournament champion {w[k,ℓ]Tx}g ( \mathbf { x } ) = \text { tournament champion } \left\{ \mathbf { w } _ { [ k , \ell ] } ^ { T } \mathbf { x } \right\}g(x)= tournament champion {w[k,ℓ]Tx}
其优缺点是:
- pros: efficient (‘smaller’ training problems), stable, can be coupled with any binary classification approaches
更有效率更加稳定,可以结合任何二分类方法 - cons: use O(K2) w[k,l]O(K^2) \,\mathbf { w }_ { [ k , l ] }O(K2)w[k,l],more space, slower prediction, more training。
需要训练O(K2)O(K^2)O(K2) 个 ,w[k,l],\mathbf { w }_ { [ k , l ] },w[k,l],占用更多的时间和空间。

本文深入探讨了多分类问题中的两种核心策略:One-Versus-All(OVA)和One-Versus-One(OVO)分解方法。OVA通过将每个类别与其他所有类别进行对比,创建多个二分类模型;而OVO则通过比较每对类别,建立更大量的二分类器。文章详细解析了两种方法的实现过程,以及各自的优缺点。
1万+

被折叠的 条评论
为什么被折叠?



