深度学习——激活函数(Sigmoid/ReLU/Softplus/Swish/Maxout)

最新推荐文章于 2025-04-21 09:22:00 发布

weixin_43216017

最新推荐文章于 2025-04-21 09:22:00 发布

阅读量3.1k

点赞数 4

分类专栏：机器学习文章标签：深度学习激活函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_43216017/article/details/89791481

版权

激活函数在深度学习中至关重要，用于引入非线性。Sigmoid和Tanh虽然连续可导但存在饱和区；ReLU及其变种如Leaky ReLU解决了饱和问题，但可能导致神经元死亡；Softplus是ReLU的平滑版；Swish是自调节门控函数；Maxout通过多个最大值选择实现非线性。这些函数各有优缺点，适用于不同的网络结构和任务。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

激活函数的作用

激活函数对于深度学习来说非常的重要，我们假设现在有n个神经元 $x_1,\dots,x_n$ ，其参数为 $w_1,\dots,w_n$ ，偏置为b。
$\sum_{i=1}^{n}w_ix_i+b$
$a = f (z)$ 其中f为激活函数。

我们可以发现如果没有激活函数的话，那么神经网络就变成了线性函数的不断嵌套，对于非线性关系学习不好。

激活函数需要的性质

连续可导的非线性函数，这样可以拟合非线性关系还可以用数值优化求解。
激活函数及其导数其形式必须简单，这样加快网络的学习。
激活函数的导数不能太大或者太小，最好稳定在1左右。太大会梯度爆炸，太小会梯度消失。

激活函数的种类

1.Sigmoid型

常用的Sigmoid型函数有两种，第一个是logistic函数，第二个是tanh函数。这两个函数都是连续可导的，并且导数都不大，所以性质比较好，但是缺点在于他们都是两端饱和的，导数趋近于0。

logistic函数

定义： $\sigma(x)=\dfrac{1}{1+exp(-x)}$

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。