【深度学习】Softmax 函数

原创已于 2023-01-25 16:42:24 修改 · 1w 阅读

CC 4.0 BY-SA版权

文章标签：

于 2018-02-01 18:16:44 首次发布

79 篇文章

订阅专栏

本文介绍了Softmax函数的基本概念及其在分类任务中的应用。Softmax函数能够将向量压缩至[0,1]区间内，同时确保所有元素之和为1。文章还对比了Softmax与Sigmoid函数的区别，并探讨了其在深度学习中的使用场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Softmax函数，又称 归一化指数函数 。

该函数是最流行的分类任务目标函数，也是 Sigmoid函数的一种推广。可转换为交叉熵误差 (CE) 。

Softmax 将向量 等比例压缩 到 [0, 1]之间，且保证 所有元素之和为1 。

$\frac{e^{h_{y_{i}}}}{{\sum_{j=1}^C}e^{h_{j}}}$

举例：softmax( [1, 2, 3, 4, 1, 2, 3] ) = [0.024, 0.064, 0.175, 0.475, 0.024, 0.064, 0.175]

	Softmax	Sigmoid
公式	$\sigma (\mathbf {z} )_{j}={\frac {e^{z_{j}}}{\sum _{k=1}^{K}e^{z_{k}}}}$	$S(x)={\frac {1}{1+e^{-x}}}.$
本质	离散概率分布	非线性映射
任务	多分类	二分类
定义域	某个一维向量	单个数值
值域	[0,1]	(0,1)
结果之和	一定为 1	为某个正数