降低过拟合的方法:
降低过拟合风险的方法
所有为了减少测试误差的策略统称为正则化方法,这些方法可能会以增大训练误差为代价。
- 数据增强
- 图像:平移、旋转、缩放
- 利用生成对抗网络(GAN)生成新数据
- NLP:利用机器翻译生成新数据
- 降低模型复杂度
- 神经网络:减少网络层、神经元个数
- 决策树:降低树的深度、剪枝
- ...
- 权值约束(添加正则化项)
- L1 正则化
- L2 正则化
- 集成学习
- 神经网络:Dropout
- 决策树:随机森林、GBDT
- 提前终止
降低过拟合的方法:
所有为了减少测试误差的策略统称为正则化方法,这些方法可能会以增大训练误差为代价。