目标检测——基本数据增广（旋转、裁剪、缩放、填充、亮暗、对比度等）

最新推荐文章于 2024-11-23 16:08:03 发布

原创

最新推荐文章于 2024-11-23 16:08:03 发布 · 4.3k 阅读

43 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #python #计算机视觉 #numpy

本文详细介绍了图像处理中常用的图像增强方法，包括亮度、对比度和颜色调整，随机填充、裁剪、缩放和翻转，以及真实框的处理。通过这些技术，可以有效提升图像数据集的质量和多样性，对训练更鲁棒的计算机视觉模型至关重要。

图像处理的主要函数文件：image_utils.py

# -*- coding: utf-8 -*-

import numpy as np
import cv2
from PIL import Image, ImageEnhance
import random

from box_utils import multi_box_iou_xywh, box_crop

# 随机改变亮暗、对比度和颜色等
def random_distort(img):
    # 随机改变亮度
    def random_brightness(img, lower=0.5, upper=1.5):
        e = np.random.uniform(lower, upper)
        return ImageEnhance.Brightness(img).enhance(e)
    # 随机改变对比度
    def random_contrast(img, lower=0.5, upper=1.5):
        e = np.random.uniform(lower, upper)
        return ImageEnhance.Contrast(img).enhance(e)
    # 随机改变颜色
    def random_color(img, lower=0.5, upper=1.5):
        e = np.random.uniform(lower, upper)
        return ImageEnhance.Color(img).enhance(e)

    ops = [random_brightness, random_contrast, random_color]
    np.random.shuffle(ops)

    img = Image.fromarray(img)
    img = ops[0](img)
    img = ops[1](img)
    img = ops[2](img)
    img = np.asarray(img)

    return img

# 随机填充
def random_expand(img,
                  gtboxes,
                  max_ratio=4.,
                  fill=None,
                  keep_ratio=True,
                  thresh=0.5):
    if random.random() > thresh:
        return img, gtboxes

    if max_ratio < 1.0:
        return img, gtboxes

    h, w, c = img.shape
    ratio_x = random.uniform(1, max_ratio)
    if keep_ratio:
        ratio_y = ratio_x
    else:
        ratio_y = random.uniform(1, max_ratio)
    oh = int(h * ratio_y)
    ow = int(w * ratio_x)
    off_x = random.randint(0, ow - w)
    off_y = random.randint(0, oh - h)

    out_img = np.zeros((oh, ow, c))
    if fill and len(fill) == c:
        for i in range(c):
            out_img[:, :, i] = fill[i] * 255.0

    out_img[off_y:off_y + h, off_x:off_x + w, :] = img
    gtboxes[:, 0] = ((gtboxes[:, 0] * w) + off_x) / float(ow)
    gtboxes[:, 1] = ((gtboxes[:, 1] * h) + off_y) / float(oh)
    gtboxes[:, 2] = gtboxes[:, 2

最低0.47元/天解锁文章

5 条评论

cskaxlj1126 2021.05.28
跟原代码上不同的地方就加了这几条吗？？？ [code=python] # 随机裁剪 img, gtboxes, gtlabels, = random_crop(img, gtboxes, gtlabels) # 随机缩放 img = random_interp(img, size) # 随机翻转 img, gtboxes = random_flip(img, gtboxes) # 随机打乱真实框排列顺序 gtboxes, gtlabels = shuffle_gtbox(gtboxes, gtlabels) [/code] 运行时会报错
- 摆脱咸鱼回复cskaxlj1126 2022.12.11
  对，那个最后的get_img_data在ready.py中，没啥用，没改哪里
- liuz_notes回复cskaxlj1126 2021.05.29
  请问你添加了box_utils的相关代码了吗，文中所有代码是完整的，亲测可用

只会git clone的程序员 2020.05.29
训练了多久啊，随便一泡就得几个小时这咋搞
- liuz_notes回复只会git clone的程序员 2020.05.30
  [reply]qq_37668436[/reply]这只是用于目标检测数据增强的一些函数，没有训练啊。训练时间是由你的任务的要求和数据集大小决定的