过拟合的处理方法总结

最新推荐文章于 2025-11-06 19:26:30 发布

原创最新推荐文章于 2025-11-06 19:26:30 发布 · 446 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

算法同时被 2 个专栏收录

13 篇文章

订阅专栏

9 篇文章

订阅专栏

1. L1&L2参数正则化

基本的思想是对参数进行约束，在保证取得最小的损失函数的同时衰减不相关特征的参数。具体可以看另外一篇博文：L1 & L2 正则化的理解

2. Dropout

集成思想，同时减少每层的神经节点之间的相互依赖。

3. 数据增强

原始的思想是扩充数据集，增强泛化能力。裁剪/翻转/颜色亮度变化。

4. 迁移学习

当你的数据集比较小，训练的网络过拟合，泛化能力比较差，你也可以不用大的数据集再去训练，可以采用迁移学习，即fine-tuning一个既成的网络。对于小型的数据集训练，只需要freeze前面的网络参数，然后单独学习最后的全连接层。如果你有更多的数据，那么可以逐渐训练更多的最后几层的网络。注意一个通用的策略：在学习的时候需要将学习率调的很低很低，大约只有原始训练的十分之一，因为原始的网络结构已经是收敛的了，只希望做一些微小的调整。

这里写图片描述

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。