将多分类归结为二分类,有两种简单方法:
1、类A——非类A 单类别与补集分类
2、类A——类B 单类别与单类别分类
举个简单线性分类例子:
对于左图,可使用方法1,因为类别与补集直接线性可分
对于右图,每个类别都不可与其补集线性分割,
但两类之间线性可分
可见“两类间线性可分”这一命题弱于“类别与补集线性可分”
特别地,对于未分类数据X,由类I观测到X概率P(X | I),由J观测到X概率P(X | J),即使不能得到具体数据,若能比较P(X | I)与P(X | J)
进一步,任意两类概率皆可比较,则能对所有观测到X的各概率排序,就能找到最佳预测。(排序这一过程的本质操作就是两两元素比较)
本文探讨了如何将复杂多分类问题简化为二分类问题,并通过实例展示了这一方法在分类问题上的优势。文章指出,对于某些情况下,直接区分一类与其余类别的补集更为直观且易于实现,而当类别间直接线性可分性不明显时,通过比较不同类别下样本的概率可以间接进行分类。最后,文章强调了比较操作在排序和预测中的关键作用。
1153

被折叠的 条评论
为什么被折叠?



