激活函数总结(一)

最新推荐文章于 2024-08-02 20:09:57 发布

sqiu_11

最新推荐文章于 2024-08-02 20:09:57 发布

阅读量1.2k

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习-激活函数文章标签：激活函数机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/sqiu_11/article/details/78394495

机器学习-激活函数专栏收录该内容

1 篇文章

订阅专栏

本文介绍了激活函数的作用及其在神经网络中的重要性。详细讨论了Sigmoid、Tanh、ReLU及Softmax等常见激活函数的特点与应用场景，并对比它们之间的优缺点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Introduce

激活函数可以理解为非线性映射，增加网络的复杂性。为什么这么说？
如图所示：
这里写图片描述
第一部分是对输入的加权求和的过程，是一个线性化表示。如果不用激励函数，每一层输出都是上层输入的线性函数，无论神经网络有多少层，输出都是输入的线性组合。如果使用的话，激活函数给神经元引入了非线性因素，可以证明可以任意逼近任何非线性函数，这样神经网络就可以应用到众多的非线性模型中。

都有哪些激活函数？有什么特性？为什么不能统一？

如图：
Sigmoid
Sigmoid:计算量大，训练慢，存在左、右两端的“软饱和区”，导致梯度消失！输出值均大于0，导致多层神经网络的输入均值不为0，偏移现象！
Tanh和Relu
Tanh：计算量大，存在梯度消失现象，不存在偏移现象
Relu：计算量小，训练快，存在“硬饱和区”使得神经元死亡——权值无法更新，使得网络稀疏，避免过拟合！也存在偏移现象！改进“硬饱和区”：Prelu函数和Random Relu函数。在卷积神经网络中：
这里写图片描述
Softmax用于多分类
Softmax：(软最大的含义在于取得最大值的概率最大)，用于多分类，返回每一类的概率类与类之间是互斥的！计算简单，使用交叉熵表示损失函数：与标准样本距离！

总结：

不同的激活函数具有不同数学性质，导致表达能力不一样，泛化能力，训练效果都不一样！需要实践中尝试才能选择最佳激活函数，具体问题具体分析！

参考文章：

1、深度探讨激活函数区别
2、常用激活函数的简介
3、Softmax 函数的特点和作用是什么
4、为什么神经网络中激活函数Relu优于Sigmoid
5、Relu和其改进版的比较

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。