基于YOLOv5测试图像增强效果。由于发票提取数据仅有1k左右,和数据增强整体效果与各种增强方法效果的不确定性,通过实验确认图像增强效果与增强方法的选定。基本方法是将增强后的图片与标签直接混入原始图像与标签中进行实验。
图像增强方法如下:
- Rotate:小角度旋转
- AddToHueAndSaturation:同时更改色相和饱和度
- WithPolarWarping:极射,类似写轮眼的神威,对图片进行扭曲
- Dropout:随机失活
- BlendAlpha:Alpha融合,不论是在3D还是2D中都常见,最常见的应用就是:设置图片的透明度,不透明度,可以实现抠图。
- AdditiveGaussianNoise:加性高斯白噪声
- 加性指的是叠加在某信号上
- 高斯指的是概率分布里的正态分布函数
- 白噪声指的是它的二阶矩不相关,一阶矩为常数,是指先后信号在时间上的相关性
- 如果这个噪声的幅度服从高斯分布,功率谱密度又是均匀分布的,则称他为高斯白噪声
- Multiply:改变亮度, 不影响bounding box
- Affine:平移后缩放,会影响bounding box
实验思路:综合时间成本等因素,测试8种增加方法。将每一种增强方法与原始图像混合,形成8份增强数据与1份原始数据。对8份增强数据单独训练,比较训练结果,主要是mAP@.5:.95指标,统计优于原始图像的标签项。
在具体实验中的下表(共16个标签),当增强数据mAP@.5:.95>原始数据mAP@.5:.95时,认定该标签表现有提升。
| 数据增强方法 | 提升标签数量 |
| Ro |

本文探讨了数据增强在图像识别任务中的作用,特别是针对YOLOv5模型。通过实验,作者对比了多种图像增强技术,如旋转、色相饱和度调整、极射扭曲等,对模型性能的影响。实验结果显示,旋转、随机失活和仿射变换对目标检测的mAP@.5:.95指标有显著提升。经过进一步的训练和混合增强数据,证实了数据增强对于提高模型性能的有效性。
最低0.47元/天 解锁文章
2258

被折叠的 条评论
为什么被折叠?



