深度学习之激活函数

借180

于 2024-03-23 17:49:43 发布

阅读量535

点赞数 14

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_62737318/article/details/136971294

版权

给定一个线性变换，不管经过多个线性变换，最终只能解决线性问题，那么这时需要在线性单元后加上一个非线性单元的函数，这类似于高中学过的神经元。因此这样的函数被称为激活函数（必须为非线性函数）。

而且激活函数必须可导，而且x取值范围必须是R应该是单调递增的s型曲线。

下面是常用的激活函数：

会有梯度消失现象，且导数最大值为0.25，这表示反向传播时，每层梯度会递减大概0.25。这会导致当网络层数很多或某层出现极端的输出反向传播的链式法则时会导致前几层的梯度几乎为0，参数不会更新。这里的四层网络等价于两层网络。这被称为梯度消失现象。

且其为非零均值函数，由前面可知导数始终大于零，那么会被强制同时正向或反向更新。这会使神经网络更慢的收敛到指定位置

ReLu函数：

ReLU函数的优点：

缺点：

非零均值函数会影响网络的收敛效果---可用输出的归一化来解决。

relu函数没有上限，如果线性单元输出过大，或者网络是循环结构这就可能会导致梯度累计超出计算机的数值上限。这便是梯度爆炸现象。需要参数初始化和重新设置网络结构来解决。还有可能会神经元坏死。

为了解决这个问题提出了leaky relu函数，在保证稀疏性的前提下也避免了神经元的坏死。

后面出现了一种将负半轴的梯度值更换成可以动态学习调整的参数。是否保持稀疏性和神经元都要通过训练过程来确定。

总结：

博客等级

码龄4年

46
原创

497
点赞

316
收藏

391
粉丝

关注

私信

热门文章

最新评论

深度学习-优化策略
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
cnn卷积神经网络
借180: https://pytorch.org/get-started/previous-versions/
cnn卷积神经网络
借180: conda install pytorch==1.6.0 torchvision==0.7.0 cudatoolkit=10.1
cnn卷积神经网络
借180: conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.1
鸿蒙开发-第三方库axios
优快云-Ada助手: “恭喜博主发布了第19篇博客，内容涉及到鸿蒙开发中的第三方库axios，对鸿蒙开发者来说是非常有价值的内容。希望博主能够继续坚持创作，为大家分享更多有关鸿蒙开发的知识和经验。建议博主在接下来的创作中，可以考虑结合实际案例或者开发经验，为读者提供更具体的指导和帮助。期待博主的更多精彩作品。”

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。