Pytorch-YOLOv3源码解读（数据集加载和预处理）

最新推荐文章于 2025-03-24 16:21:21 发布

暮丶凉

最新推荐文章于 2025-03-24 16:21:21 发布

阅读量670

点赞数

分类专栏：深度学习

本文链接：https://blog.youkuaiyun.com/qq_19457459/article/details/112618237

版权

本文档介绍了PyTorch实现的YOLOv3模型中数据集加载和预处理的详细过程，包括从COCO2014数据集读取图像和标签，以及图像的预处理步骤，如水平翻转。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

系列文章目录

数据集加载和预处理
网络结构
loss计算

文章目录

系列文章目录
前言
数据读取类datasets.py

前言

源代码连接https://github.com/eriklindernoren/PyTorch-YOLOv3
当前代码用到的数据集为coco2014，这里提供官网地址https://cocodataset.org/

数据读取类datasets.py

根据传入的index索引值，去读取数据中的图像和标签，图像进行简单的预处理过程

import glob
import random
import os
import sys
import numpy as np
from PIL import Image
import torch
import torch.nn.functional as F

from utils.augmentations import horisontal_flip
from torch.utils.data import Dataset
import torchvision.transforms as transforms

# 图像填充为等宽等高
def pad_to_square(img, pad_value):
    c, h, w = img.shape
    dim_diff = np.abs(h - w)
    # (upper / left) padding and (lower / right) padding    # 高宽之差为2的整数倍时
    pad1, pad2 = dim_diff // 2, dim_diff - dim_diff // 2    # 两边填充等长宽度，不同时右边比左边多一个
    # Determine padding
    pad = (0, 0, pad1, pad2) if h <= w else (pad1, pad2, 0, 0)  # 选择填充高或宽
    # Add padding
    img = F.pad(img, pad, "constant&#