Softmax回归

一、回归 VS 分类

回归:估计一个连续值(比如房价)

  • 单连续数值输出
  • 自然区间 RRR
  • 跟真实值的区别作为损失(预测值-真实值)2^22
    在这里插入图片描述

分类:预测一个离散类别(预测图片里是猫还是狗)

  • 通常是多个输出
  • 输出 iii 是预测为第 iii 类的置信度
    在这里插入图片描述

二、从回归到多类分类 —— 均方损失

  • 对类别进行一位有效编码(one - hot,独热编码)
    在这里插入图片描述

  • 使用均方损失训练

  • 最大值作为预测
    选取 iii,使得 oio_ioi 最大化的值作为预测值 yyy^
    在这里插入图片描述
    我们关心的是对正确的类别置信度最大(关心的是置信度的相对大小):

  • 需要更置信的识别正确类(大余量),确保模型可以将正确类和其他类拉开距离
    在这里插入图片描述

  • 输出匹配概率(非负,和为1)
    原本的输出是 [o1,...,on][o_1, ... ,o_n][o1,...,on] 这个向量,想要输出对每个类别的匹配概率:
    引入一个操作子:softmaxsoftmaxsoftmax,将 softmaxsoftmaxsoftmax 作用于 ooo 得到 yyy^。
    yyy^ 是一个长为 nnn 的向量,但它有我们想要的属性:每个元素都非负,而且和为1 ——> 概率
    在这里插入图片描述

  • 概率 yyy (真实)和 yyy^ (预测)的区别作为损失

三、Softmax和交叉熵损失

一般来说,我们使用交叉熵(cross-entropy)来衡量两个概率的区别。

  • 交叉熵常用来衡量两个概率的区别
    pppqqq 是两个概率
    在这里插入图片描述
  • 将它作为损失(对于 iii 来说, yyy 向量只有 yiy_iyi 为1,所以可以简化为:对于真实类别的预测值取−log-loglog
    可以看出,对于分类问题来讲,我们不关心对于非正确类的预测值,只关心对于正确类的预测值的置信度要多大。
    在这里插入图片描述
  • 其梯度是真实概率和预测概率的区别
    在这里插入图片描述

四、总结

  • SoftmaxSoftmaxSoftmax 回归是一个多类分类模型
  • 使用 SoftmaxSoftmaxSoftmax 操作子得到每个类的预测置信度(概率,非负,和为1)
  • 使用交叉熵来衡量预测和标号的区别
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值