Softmax回归

最新推荐文章于 2025-08-15 11:07:24 发布

原创最新推荐文章于 2025-08-15 11:07:24 发布 · 333 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#回归 #机器学习 #人工智能

强化学习专栏收录该内容

1 篇文章

订阅专栏

一、回归 VS 分类

回归：估计一个连续值（比如房价）

单连续数值输出
自然区间 $R$
跟真实值的区别作为损失（预测值-真实值） $^2$

分类：预测一个离散类别（预测图片里是猫还是狗）

通常是多个输出
输出 $i$ 是预测为第 $i$ 类的置信度

二、从回归到多类分类 —— 均方损失

对类别进行一位有效编码（one - hot，独热编码）
使用均方损失训练
最大值作为预测
选取 $i$ ，使得 $o_i$ 最大化的值作为预测值 $y$ ^

我们关心的是对正确的类别置信度最大（关心的是置信度的相对大小）：
需要更置信的识别正确类（大余量），确保模型可以将正确类和其他类拉开距离
输出匹配概率（非负，和为1）
原本的输出是 $o_1, ... ,o_n]$ 这个向量，想要输出对每个类别的匹配概率：
引入一个操作子： $so f t ma x$ ，将 $so f t ma x$ 作用于 $o$ 得到 $y$ ^。
$y$ ^ 是一个长为 $n$ 的向量，但它有我们想要的属性：每个元素都非负，而且和为1 ——> 概率。
概率 $y$ （真实）和 $y$ ^ （预测）的区别作为损失

三、Softmax和交叉熵损失

一般来说，我们使用交叉熵（cross-entropy）来衡量两个概率的区别。

交叉熵常用来衡量两个概率的区别
$p$ 和 $q$ 是两个概率
将它作为损失（对于 $i$ 来说， $y$ 向量只有 $y_i$ 为1，所以可以简化为：对于真实类别的预测值取 $- l o g$ ）
可以看出，对于分类问题来讲，我们不关心对于非正确类的预测值，只关心对于正确类的预测值的置信度要多大。
其梯度是真实概率和预测概率的区别

四、总结

$S o f t ma x$ 回归是一个多类分类模型
使用 $S o f t ma x$ 操作子得到每个类的预测置信度（概率，非负，和为1）
使用交叉熵来衡量预测和标号的区别

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。