分类与回归(如何把分类问题转化为回归问题解决)

如何把分类问题转化为回归问题解决

一、分类与回归的区

我们都知道,有监督学习算法都在做一样事情,那就是预测。但是显然,针对不同的事件,我们有不同的预测的目标。其中,预测目标的形式(变量)有离散和连续两种类型。

我们将预测离散变量的行为称为分类,将预测连续变量的行为称为回归。

二、分类如何转化为回归

分类问题转化为回归问题是基于概率体系的。
我们在回归问题中,试图找到一种映射关系,满足样本特征与标签的分布(这种映射往往是函数)。
而在预测一件事物是不是属于某一类别时,我们通过回归来预测这件事物属于这一类别的概率(这个回归最后会拟合出一个函数)

  • 比如,在单输出线性回归中,我们假定事物属于某一类别的概率与它的特征分布是满足线性关系的,所以我们会用回归去拟合一条线性函数,这条函数最后会被用来判断某一无标签样本属于这一类的概率值。

三、多分类和多输出回归(multi-output regression)

多分类很好理解,但是它有几种不同的情况,在这里不得不强调一下:

  1. OvO(一对一):对于n个类别,该种方法将其两两配对,训练了n*(n+1)/2个分类器,每个分类器都处理一个二分类任务,最后通过投票决定(例如:将预测最多的类作为最终分类的结果)。[该种方法虽然要训练O(n2n^2
### 如何将分类问题转化为回归问题 在某些情况下,可以通过特定的技术手段将分类问题转化为回归问题。这种方法的核心在于重新定义目标变量的形式及其损失函数的设计。 #### 转化方法 1. **概率估计** 对于多类别分类问题,通常会通过 softmax 函数计算每个类别的概率分布。如果希望将其视为回归问题,则可以直接预测这些概率值而不是离散标签[^1]。此时的目标是让模型输出的概率向量尽可能接近真实分布。 2. **连续化处理** 将原本的离散标签映射到实数空间上的一种方式是对每种类别赋予一个唯一的数值编码(例如 one-hot 编码后的加权平均),从而使得原始分类任务能够被建模为对这些数值的逼近过程[^2]。 3. **自定义损失函数** 当把分类当作回归来做时,传统的交叉熵不再适用;因此需要引入均方误差(MSE)或其他适合衡量两个数值之间差异程度的标准来评估性能表现的好坏情况。 ```python import torch.nn as nn class ClassificationAsRegression(nn.Module): def __init__(self, input_dim, output_dim): super(ClassificationAsRegression, self).__init__() self.fc = nn.Linear(input_dim, output_dim) def forward(self, x): return self.fc(x) criterion = nn.MSELoss() # 使用MSE代替CrossEntropyLoss ``` --- ### 如何将回归问题转化为分类问题 同样地,在另一些场景下也可以考虑反向操作——即将回归问题转成分类形式加以解决。 #### 转化方法 1. **区间划分** 把连续型响应变量按照一定规则分割成若干个互斥且穷尽的小范围子集,并给定相应的新标记号表示所属组别归属关系即可完成此转变动作。例如房价预测可设阈值如<50万=低档,<100万=中档>=高档三个等级来进行简化分析流程。 2. **二元判定逻辑构建** 如果仅需判断某项指标是否超过固定界限值的话那么就可以简单设置yes/no两类答案构成基本框架结构用于后续训练阶段当中去执行具体运算步骤啦! ```python def discretize_target(y_continuous, thresholds=[50, 100]): labels = [] for value in y_continuous: if value < thresholds[0]: labels.append(0) # Low tier elif thresholds[0] <= value < thresholds[1]: labels.append(1) # Medium tier else: labels.append(2) # High tier return torch.tensor(labels).long() y_discrete = discretize_target(y_true.numpy(), thresholds=[50, 100]) ``` --- ### 应用场景举例 - **推荐系统中的评分预测** 原始问题是给出用户对于物品的具体打分分数属于典型的回归任务范畴之内;然而当我们将关注重点放在区分好评差评这两个极端状态之上时候便自然过渡成为了另一种意义上的二分类或者多分类性质的任务了。 - **医学影像诊断辅助工具开发过程中遇到的情况说明如下所示:** - 输入CT扫描图像序列片段; - 输出病变区域存在否的结果指示信号(即布尔类型的True/False标志位)或者是更进一步细化描述损伤严重性的分级标准体系下的量化评价指数等等不同类型的信息表达模式均可视作此类转化的实际案例体现之一例证而已。 ---
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值