Pytorch基础之——（五）Pytorch实现L1，L2正则化以及Dropout

最新推荐文章于 2024-07-27 20:21:33 发布

原创

最新推荐文章于 2024-07-27 20:21:33 发布 · 939 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

本文介绍了Dropout的原理，它是一种防止深度神经网络过拟合的优化方法。通过随机失活神经元，避免节点间的过度依赖，提高泛化能力。同时，讲解了L1和L2正则化的概念，并提供了用代码实现正则化和 Dropout 的方法，包括在PyTorch中的具体应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

（五）Pytorch实现L1，L2正则化以及Dropout

1.了解知道Dropout原理
2.用代码实现正则化(L1、L2、Dropout）
3.Dropout的numpy实现
4.Pytorch中实现dropout
5.参考资料

1.了解知道Dropout原理

dropout，随机失活，是一种对深度神经网络的优化方法，可以防止过拟合、提升效率和在测试集上的效果。

动机：引用自百度百科

随机失活是为解决深度神经网络的过拟合（overfitting）和梯度消失（gradient vanishing）问题而被提出的优化方法，其一般设想是在神经网络的学习过程中，随机将部分隐含层节点的权重归零，由于每次迭代受归零影响的节点不同，因此各节点的“重要性”会被平衡 [3-4] 。引入随机失活后，神经网络的每个节点都会贡献内容，不会出现少数高权重节点完全控制输出结果的情况，因此降低了网络的结构风险 [1] 。

做法：参考博客

Dropout的具体实现中，要求某个神经元节点激活值以一定的概率p被“丢弃”，即该神经元暂时停止工作。对于任意神经元，每次训练中都与一组随机挑选的不同的神经元集合共同进行优化，这个过程会减弱全体神经元之间的联合适应性，减少过拟合的风险，增加泛化能力。

2.用代码实现正则化(L1、L2、Dropout）

L2正则化是在原来的损失函数上加上模型权重参数的平方和。
L1正则化则是在原来的损失函数上加上权重参数的绝对值之和。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。