过拟合解决方法总结（不断更新）

最新推荐文章于 2024-04-02 15:10:07 发布

一只很菜很菜的tfer

最新推荐文章于 2024-04-02 15:10:07 发布

阅读量1.2k

点赞数

分类专栏：计算机视觉学习小记录

本文链接：https://blog.youkuaiyun.com/weixin_39122088/article/details/108533113

版权

计算机视觉学习小记录专栏收录该内容

9 篇文章

订阅专栏

解决过拟合的方法很多，有些方法每次用到的时候都需要百度，因此发个文，将以后用到的缓解过拟合方法总结在这里。（不断更新）
关于dropout、增加数据、正则化、early stopping这些常用缓解过拟合的方法外，还有一些方法也能起到不错的效果，列举如下

1.交叉验证
参考地址
在这里插入图片描述
将原始数据分成K组（一般是均分），将每个子集数据分别做一次验证集，其余的K-1组子集数据作为训练集，这样会得到K个模型，用这K个模型最终的验证集的分类准确率的平均数作为此K-CV下分类器的性能指标。K一般大于等于2，实际操作时一般从3开始取，只有在原始数据集合数据量小的时候才会尝试取2。

应用最多，K-CV可以有效的避免过拟合与欠拟合的发生，最后得到的结果也比较具有说服性。

2.随机擦除（Random Erasing Augmentation）
参考地址
在这里插入图片描述
Random Erasing Augmentation（REA）是一种随机擦除的数据增广方法。简单而言就是在图像中随机选择一个区域，打上噪声mask。这个mask可以是黑块、灰块也可以是随机正太噪声。直接看图就能明白，具体细节可以看论文。所有参数都是直接利用原论文的参数。随机擦除是一种数据增广的方式，可以降低模型过拟合的程度，因此可以提升模型的性能。

3.标签平滑（Label smoothing）
标签平滑（LS）是论文[3]提出的一种方法，应用于分类任务。传统的分类任务用的是交叉熵损失，而监督label用的是one-hot向量。因为交叉熵是相对熵在one-hot向量前提下的一种特例。但是one-hot是一种很强的监督约束。为了缓和label对于网络的约束，LS对标签做了一个平滑：
在这里插入图片描述