逻辑回归与Softmax

Softmax函数是一种将一个含任意实数的K维向量转化为另一个K维向量的函数,这个输出向量的每个元素都在(0, 1)区间内,并且所有元素之和等于1。
因此,它可以被看作是某种概率分布,常用于多分类问题中作为输出层的激活函数。这里我们以拓展逻辑回归解决多分类的角度对Softmax函数进行理解:

假设共有CCC 个类别,模型对输入 x\mathbf{x}x 输出 CCC个类别的得分,
则属于类别 ccc 的后验概率为:
P(y=c∣x)=eβc⊤x∑j=1Ceβj⊤x P(y = c \mid \mathbf{x}) = \frac{e^{\beta_c^\top \mathbf{x}}}{\sum_{j=1}^{C} e^{\beta_j^\top \mathbf{x}}} P(y=cx)=j=1Ceβjxeβcx
其中 βc\beta_cβc 是第 ccc 类对应的参数向量,jjj 是求和的类别索引,x\mathbf{x}x 是输入特征向量。

为什么使用指数函数 eee?

Softmax 函数的形式为:
σ(z)i=ezi∑j=1Cezj, \sigma(\mathbf{z})_i = \frac{e^{z_i}}{\sum_{j=1}^{C} e^{z_j}}, σ(z)i=j=1Cezjezi,
其中每个得分 ziz_izi 的形式为:
zi=βi⊤x, z_i = \beta_i^\top \mathbf{x}, zi=βix,
表示输入特征向量 x\mathbf{x}x 与第 iii 类对应的参数向量 βi\beta_iβi 的线性组合。

使用指数函数 ezie^{z_i}ezi 有以下几点重要理由:

  • 非负性:对于任意实数 ziz_izi,都有 ezi>0e^{z_i} > 0ezi>0。这保证了 Softmax 输出的概率值始终为正数。

  • 保持序关系:指数函数是严格单调递增函数。若 zi>zjz_i > z_jzi>zj,则 ezi>ezje^{z_i} > e^{z_j}ezi>ezj,从而保留了原始得分之间的相对大小关系。

  • 便于求导:指数函数具有良好的可导性,且其导数形式简单(ddxex=ex)\left(\frac{d}{dx}e^x = e^x\right)(dxdex=ex),这对基于梯度下降等优化算法非常友好。

  • 映射到概率分布:通过除以总和 ∑j=1Cezj\sum_{j=1}^{C} e^{z_j}j=1Cezj,使得所有类别的输出加起来等于 1,形成一个合法的概率分布。

下面的示意图清晰地表示 Softmax 函数的原理和计算过程。以下是一个完整的推导流程示例,包括线性回归输出、Softmax 激活函数的应用,以及最终的分类结果。

(0.500.70.50.50.90.10.10.60.60.10)X×(−0.150.952.2)β=(0.5⋅(−0.15)+0⋅0.95+0.7⋅2.20.5⋅(−0.15)+0.5⋅0.95+0.9⋅2.20.1⋅(−0.15)+0.1⋅0.95+0.6⋅2.20.6⋅(−0.15)+0.1⋅0.95+0⋅2.2)=(1.3852.431.37−0.095)线性输出 z \overset{X}{\begin{pmatrix} 0.5 & 0 & 0.7 \\ 0.5 & 0.5 & 0.9 \\ 0.1 & 0.1 & 0.6 \\ 0.6 & 0.1 & 0 \end{pmatrix}} \times \overset{\bm{\beta}}{ \begin{pmatrix} -0.15 \\ 0.95 \\ 2.2 \end{pmatrix}} =\begin{pmatrix} 0.5 \cdot (-0.15) + 0 \cdot 0.95 + 0.7 \cdot 2.2 \\ 0.5 \cdot (-0.15) + 0.5 \cdot 0.95 + 0.9 \cdot 2.2 \\ 0.1 \cdot (-0.15) + 0.1 \cdot 0.95 + 0.6 \cdot 2.2 \\ 0.6 \cdot (-0.15) + 0.1 \cdot 0.95 + 0 \cdot 2.2 \end{pmatrix}=\overset{\text{线性输出 } \mathbf{z}}{ \begin{pmatrix} 1.385 \\ 2.43 \\ 1.37 \\ -0.095 \end{pmatrix}} 0.50.50.10.600.50.10.10.70.90.60

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值