deep learning

原创

已于 2023-07-30 00:59:35 修改 · 1.4k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习

于 2023-04-14 00:52:41 首次发布

过拟合是指模型在训练集上表现优秀但测试集上泛化能力下降。缓解过拟合的技术包括早停、正则化、批量归一化、Dropout等。数据增广也是有效手段。Pytorch和Tensorflow的主要区别在于动态与静态计算图，Pytorch调试更方便。torch.eval()在评估模式下影响BN和dropout的操作。PCA是降维方法，通过正交变换减少变量间的相关性。K-means是聚类算法，通过迭代更新聚类中心来分组数据。

什么是过拟合？深度学习的过拟合如何缓解？

过拟合一般指过度在训练集上进行优化，反而损害了测试集上的泛化能力的现象。一般出现训练集的loss下降，测试集的指标不降反增，就说明出现了过拟合。

在模型层面我们可以通过Early Stop, L1/L2 Regularization, Batchnorm, Dropout,weight decay等方法进行缓解。

在输入数据层面，我们可以通过数据增广来进行缓解，如旋转，图像直方图正则化，以及Mixup等方法。

欠拟合、过拟合判断方法

1.通过Loss判断
训练集loss 不断下降，验证集loss不断下降：网络正常，仍在学习。
训练集loss 不断下降，验证集loss趋于不变，可能出现过拟合，数据分布不均匀。
训练集loss 不断下降，验证集loss不断上升，可能出现过拟合。
训练集loss 趋于不变，验证集loss不断下降，数据集有问题。
训练集loss 趋于不变，验证集loss趋于不变，学习过程中遇到瓶颈，可以减小学习率或批量数目和更换梯度优化算法，也有可能网络设计问题。
训练集loss 不断上升，验证集loss不断上升，可能网络结构有问题，超参数设置不正确
2.通过Accuracy判断
验证集的作用是在训练的过程对对比训练数据与测试数据的准确率，便于判断模型的训练效果是过拟合还是欠拟合。
过拟合：训练数据的准确率较高而测试数据的准确率较低
欠拟合：训练数据的准确率和测试数据的准确率均较低
欠拟合
（1）在保证训练误差和验证误差差距在一定范围内，适当增加训练次数。
（2）增加特征
（3）减少正则化程度