目标检测与图像中的数据增强

数据增强就是让一张图片变得更加多样,本质上是一个东西但由于不同的图像处理方式使得略有不同。通过寻找这些样本中的相似特征来放入神经网络训练提高网络的鲁棒性,降低各方面额外因素对识别的影响,解决模型过拟合。

目标检测中的图像增强

PS:在目标检测的数据增强的过程中,还要考虑图片扭曲后框(box)的位置,即框出要识别的物体。

在这里插入图片描述
绿色的模型十分僵硬,无法忽视微小的扰动。
黑色的模型虽然正确率稍低,但可以反映红蓝点位置分布的主要特征。

获得合适的模型需要大量数据。数据增强是人工扩张数据集的一种方法,用来解决数据较少的情况,让有限的数据产生更多有价值的数据。

数据增强方法

首先导入import工具包

from PIL import Image,ImageEnhance,ImageChops
import numpy as
np
import random

然后打开原始图片

def open_img(image):
	return Image.open(image,mode="r")
img_name = 'img/test.jpg'
img = open_img(img_name)
img.show()
几何变化

对图像进行反转、修剪、旋转、平移。
旋转变化
在这里插入图片描述
平移变换
在这里插入图片描述
随机修剪
在这里插入图片描述
图片翻转
在这里插入图片描述

色域变化

改变RGB、对比度、亮度等。锐化和模糊的处理、随意擦除一块的像素值或是将几张图片融合在一起。

对比度增强
在这里插入图片描述
亮度增强
在这里插入图片描述
色彩抖动
色彩抖动即运用一些随即因子对图片的饱和度、亮度、对比度、锐度等进行随机调整。
在这里插入图片描述
噪声扰动
对图像进行高斯噪声处理。
注意要讲图像转化为数组,再将数组改为读写模式。因为如果不改为读写模式,无法对图像的RGB通道进行改值。
在这里插入图片描述

参考博文:
睿智的目标检测-番外篇——数据增强在目标检测中的应用(数据增强代码的参数解读).
深度学习之【数据增强】python代码详细介绍.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值