增加训练数据,则能够提升算法的准确率,因为这样可以避免过拟合,而避免过拟合就可以增大网络结构。当训练数据有限的时候,可以通过一些变换从已有的训练数据中生成一些新的数据,来扩大训练数据。数据增强的方法有:
1) 水平翻转(旋转)
2)随机裁剪(crop采样) 原始大小256*256可以随机剪切除一些224*224的图像
3)fancy PCA
4)样本不均衡
样本不均衡即有些类别图像特别多,有些特别少。类别处理不平衡数据的处理:Label shuffle
5)其他
平移变换
旋转/仿射变换
高斯噪声/模糊处理
对颜色的数据增强:图像增亮、饱和度、对比度变化
6)训练和测试要协调
通常做数据增强在训练的时候,测试很少做数据增强。不过多尺度的训练和多尺度的测试效果可能更好。
本文探讨了数据增强在提高算法准确率中的关键作用,详细介绍了六种数据增强方法,包括水平翻转、随机裁剪、fancyPCA、处理样本不均衡、变换如平移与旋转,以及对颜色数据的调整。同时,强调了训练和测试过程中数据增强的一致性对于模型性能的重要性。
3188

被折叠的 条评论
为什么被折叠?



