如何把分类问题转化为回归问题解决
一、分类与回归的区
我们都知道,有监督学习算法都在做一样事情,那就是预测。但是显然,针对不同的事件,我们有不同的预测的目标。其中,预测目标的形式(变量)有离散和连续两种类型。
我们将预测离散变量的行为称为分类,将预测连续变量的行为称为回归。
二、分类如何转化为回归
分类问题转化为回归问题是基于概率体系的。
我们在回归问题中,试图找到一种映射关系,满足样本特征与标签的分布(这种映射往往是函数)。
而在预测一件事物是不是属于某一类别时,我们通过回归来预测这件事物属于这一类别的概率(这个回归最后会拟合出一个函数)
- 比如,在单输出线性回归中,我们假定事物属于某一类别的概率与它的特征分布是满足线性关系的,所以我们会用回归去拟合一条线性函数,这条函数最后会被用来判断某一无标签样本属于这一类的概率值。
三、多分类和多输出回归(multi-output regression)
多分类很好理解,但是它有几种不同的情况,在这里不得不强调一下:
- OvO(一对一):对于n个类别,该种方法将其两两配对,训练了
n*(n+1)/2
个分类器,每个分类器都处理一个二分类任务,最后通过投票决定(例如:将预测最多的类作为最终分类的结果)。[该种方法虽然要训练O(n2n^2