1. 过拟合问题如何解决?
一般工作中不会出现过拟合问题,大部分是欠拟合问题,如果是过拟合,只需要用early_stopping处理即可。
获取更多的数据。
最直观有效的方法,有了足够的数据网络也不太容易过拟合。
数据增强。
复制现有数据并加随机噪声,重采样等,在图像领域我们可以进行不同角度旋转,平移变换,随机裁剪,中心裁剪,模糊等。
明暗,对比度,镜像,长宽比,旋转,裁剪(改变尺度)。
注:1. 数据增强必须符合训练数据的要求。
2. 每次小批量的样本也要保证类别均衡。
类均衡采样方法:1. 每个类别均衡采样。
2. 某个类别的多个特征之间均衡采样。
衡量模型的能力:泛化能力。
将数据划分为训练集,验证集和测试集。
验证集用来选择神经网络的层数和每层的神经元个数。
这样的整体收敛性更好。
如何训练网