神经网络复习--损失函数与优化

最新推荐文章于 2025-03-19 14:03:06 发布

ˇasushiro

最新推荐文章于 2025-03-19 14:03:06 发布

阅读量899

点赞数 28

分类专栏：神经网络文章标签：神经网络人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_64372178/article/details/137993528

版权

文章目录

正则化
归一化
损失函数
基于梯度的优化方法

正则化

正则化目的是尽量去简化假设模型。因为这些参数都接近0的时候，越简单的模型与被证明越不容易出现过拟合的问题

通常使用L1和L2范数，因为L0范数 $f(x)||_0$ 的结果为1求偏导之后为0无法更新参数

Dropout技术
Dropout是一类通用并且计算简洁的正则化方法。简单的说，Dropout在训练过程中，随机的丢弃一部分输入，此时丢弃部分的参数不会更新。相当于Dropout是一个集成方法，将所有子网络结果进行合并，通过随机丢弃输入可以得到各种子网络。
在这里插入图片描述
训练和使用的方法：

第一种训练好的参数乘上对应输入单元包含的概率
第二种训练阶段模型参数乘上概率的倒数

将使用的神经元乘以对应的系数使变成神经元完整的参数

注意：在测试和使用阶段不适用dropout
缺点：是会明显增加训练时间，因为引入dropout之后相当于每次只是训练原先网络的一个子网络，为了达到相同的精度需要的训练次数会增多。dropout的缺点就在于训练时间是没有dropout网络的2-3倍
优点：

相比于范数约束，该策略更有效
计算复杂度低，实现简单而且可以用于其他非深度学习模型
dropout训练过程中的随机过程不是充分也不是必要条件，可以构造不变的屏蔽参数，也能够得到足够好的解
会让神经网络在训练的时候不会使得某一个节点权重过大，压缩权重，达到类似于L2正则化的效果

归一化

归一化的目的是因为神经网络中的参数依赖于上一层的结果，上一层的参数发生变化，结果发生变化有影响这层参数的变化，因此增加归一化后保证每一层输出的结果不变可以更快的加速参数收敛
可以有效防止梯度消失和梯度爆炸。
几种归一化的计算方法基本

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

ˇasushiro 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。