常见的激活函数及其优缺点

最新推荐文章于 2025-05-16 14:34:14 发布

想念@思恋

最新推荐文章于 2025-05-16 14:34:14 发布

阅读量644

点赞数

CC 4.0 BY-SA版权

分类专栏： python编程文章标签：深度学习神经网络机器学习

本文链接：https://blog.youkuaiyun.com/tailonh/article/details/120852692

python编程专栏收录该内容

139 篇文章

订阅专栏

记录一下四种常见的激活函数
图片均来自百度图片搜索
借鉴以下文章
https://www.zhihu.com/people/long-xiang-tian-yi/posts
https://blog.youkuaiyun.com/weixin_39910523/article/details/111582159
https://blog.youkuaiyun.com/wcx1293296315/article/details/88679970

1、Sigmoid

（1）图像
ps:图片居中，在链接后边加上#pic_center
在这里插入图片描述
（2）公式
$\sigma \left ( z \right ) = \frac{1}{1+e^{-z}}$
（3）优点
           梯度平滑；
           输出值在0~1之间；
           图像不是中心对称
           激活函数中心对称的一种理解：输入的数据经过预处理后，一般都以0为均值，1为方差的，而sigmoid的输出值恒大于0，这会导致模型收敛速度变慢。

（4）缺点
计算量较大；
容易出现梯度消失–因为得到的结果都是小于1的。

2、tanh

（1）图像
在这里插入图片描述

（2）公式
$tanh\left ( x \right )=\frac{sinh\left ( x \right )}{cosh \left ( x \right )}=\frac{e^{z}-e^{-z}}{e^{z}+e^{-z}}$
（3）优点
           解决了中心对称问题。
（4）缺点
           计算量较大；
           仍然存在梯度消失问题。

3、RELU

（1）图像
在这里插入图片描述

（2）公式
$RELU=max\left ( 0,x \right )$
（3）优点
           简单，高效
           缓解梯度消失问题
（4）缺点
           Relu的输入值为负的时候，输出始终为0，其一阶导数也始终为0，这样会导致神经元不能更新参数，也就是神经元不学习了，这种现象叫做“Dead Neuron”。