激活函数（sigmoid、tanh、ReLU、leaky ReLU）

最新推荐文章于 2025-04-30 23:38:04 发布

流泪的猪

最新推荐文章于 2025-04-30 23:38:04 发布

阅读量3.4k

点赞数 6

文章标签：算法 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_45267220/article/details/128703129

版权

文章介绍了神经网络中常见的非线性激活函数，包括sigmoid、tanh、ReLU和leakyReLU，讨论了它们的公式、特性以及在解决梯度消失问题上的应用。sigmoid和tanh早期被广泛使用，但存在梯度消失问题；ReLU和leakyReLU作为改进版，更适用于深层网络训练。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

为了保证神经元的计算包含简洁性和功能性，神经元的计算包括线性计算和非线性计算。

今天主要讲集中非线性计算（即激活函数），包括:

sigmoid

tanh

ReLU

leaky ReLU

1、sigmoid函数

sigmoid函数可以将输出映射到（0,1）的区间，适合做二分类任务。

sigmoid函数公式：

$S(x)=\frac{1}{1+e^{-x}}$

其导数为：

${S}'(x)=S(x)(1-S(x))$

sigmoid函数图形为：

sigmoid函数具有平滑易于求导的优点，但是它的计算量大，反向传播时，容易出现梯度消失的情况，从未无法完成深层网络训练。

2、tanh函数

tanh函数和sigmoid函数十分相似，不同的是tanh会将输出映射到（-1,1）。

tanh函数公式：

$tanh(x)=\frac{e^{x}-e^{-x}}{e^{x}+e^{-x}}$

tanh函数导数：

$tanh'(x)=1-tanh^{2}(x)$

tanh函数图形为：

sigmoid函数和tanh函数是最早被研究的激活函数，tanh是sigmoid函数的改进版，改进了sigmoid函数不是以零为中心的问题，加快了收敛速度。因此在实际使用中，更多地是采用tanh函数。

梯度消失问题：

虽然tanh在一定程度上改进了sigmoid函数，但是观察这两种函数的图像会发现，当自变量很大或很小时，图形的斜率是接近0的。也就是说，当输入绝对值非常大的值时，输出值的变化不明显，这就是梯度消失问题。

3、ReLU

为了解决梯度消失问题，通常采用ReLU（Linear rectification function 修正线性单元）。

ReLU公式：

$f(x)=max{(0,x)}$

ReLU导数：

$f'(x)=\left\{\begin{matrix} 0&x<0 \\ 1 &x\geq 0 \end{matrix}\right.$

ReLU图形形状：

4、leaky ReLU

leaky ReLU是ReLU的一个变种，当x<0时，函数的梯度不为0，而是一个很小的常数 $\lambda\in (0,1)$ ，如0.01。

leaky ReLU公式：

$f(x)=\begin{cases} \lambda x & \text{ if } x<0 \\ x & \text{ if } x\geq 0 \end{cases}$

leaky ReLU导数：

$f'(x)=\begin{cases} \lambda & \text{ if } x<0 \\ 1& \text{ if } x\geq 0 \end{cases}$

leaky ReLU图形：

在神经网络中，不同层可以有不同的激活函数，在二元分类任务时，我们可以在最后一层（即输出层）采用sigmoid函数，其它层采用ReLU或leaky ReLU。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。