yolov3实现之模型训练，测试，检测

YoloV3模型训练与检测实战

最新推荐文章于 2025-11-07 12:10:35 发布

原创

最新推荐文章于 2025-11-07 12:10:35 发布 · 置顶 · 8.5k 阅读

29 ·

CC 4.0 BY-SA版权

文章标签：

#yolov3

前面几篇博客已经对yolov3的具体实现模块已经做了大致的讲解，基于pytorch进行模型训练，测试，检测只是对前面的模块进行组合实现，主要的还是数据的准备，加载，模型搭建，代价函数的求解。

train.py

from __future__ import division

from models import *
from utils.logger import *
from utils.utils import *
from utils.datasets import *
from utils.parse_config import *
from test import evaluate

from terminaltables import AsciiTable

import os
import sys
import time
import datetime
import argparse

import torch
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision import transforms
from torch.autograd import Variable
import torch.optim as optim

if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--epochs", type=int, default=100, help="number of epochs")
    parser.add_argument("--batch_size", type=int, default=8, help="size of each image batch")
    parser.add_argument("--gradient_accumulations", type=int, default=2, help="number of gradient accums before step")
    parser.add_argument("--model_def", type=str, default="config/yolov3.cfg", help="path to model definition file")
    parser.add_argument("--data_config", type=str, default="config/coco.data", help="path to data config file")
    parser.add_argument("--pretrained_weights", type=str, help="if specified starts from checkpoint model")
    parser.add_argument("--n_cpu", type=int, default=8, help="number of cpu threads to use during batch generation")
    parser.add_argument("--img_size", type=int, default=416, help="size of each image dimension")
    parser.add_argument("--checkpoint_interval", type=int, default=1, help="interval between saving model weights")
    parser.add_argument("--evaluation_interval", type=int, default=1, help="interval evaluations on validation set")
    parser.add_argument("--compute_map", default=False, help="if True computes mAP every tenth batch")
    parser.add_argument("--multiscale_training", default=True, help="allow for multi-scale training")
    opt = parser.parse_args()
    print(opt)

    logger = Logger("logs")

    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

    os.makedirs("output", exist_ok=True)
    os.makedirs("checkpoints", exist_ok=True)

    # Get data configuration
    data_config = parse_data_config(opt.data_config)
    train_path = data_config["train"]
    valid_path = data_config["valid"]
    class_names = load_classes(data_config["names"])

    # Initiate model
    model = Darknet(opt.model_def).to(device)
    model.apply(weights_init_normal)

    # If specified we start from checkpoint
    if opt.pretrained_weights:
        if opt.pretrained_weights.endswith(".pth"):
            model.load_state_dict(torch.load(opt.pretrained_weights))
        else:
            model.load_darknet_weights(opt.pretrained_weights)

    # Get dataloader
    #加载数据
    dataset = ListDataset(train_path, augment=True, multiscale=opt.multiscale_training)
    #整合为torch批量处理格式
    dataloader = torch.utils.data.DataLoader(
        dataset,
        batch_size=opt.batch_size,
        shuffle=True,
        num_workers=opt.n_cpu,
        pin_memory=True,
        collate_fn=dataset.collate_fn,
    )

    #网络优化器
    optimizer = torch.optim.Adam(model.parameters())

    metrics = [
        "grid_size",
        "loss",
        "x",
        "y",
        "w",
        "h",
        "conf",
        "cls",
        "cls_acc",
        "recall50",
        "recall75",
        "precision",
        "conf_obj",
        "conf_noobj",
    ]

    #迭代实现模型训练
    for epoch in range(opt.epochs):
        model.train()
        start_time = time.time()
        for batch_i, (_, imgs, targets) in enumerate(dataloader):
            batches_done = len(dataloader) * epoch + batch_i

最低0.47元/天解锁文章

25 条评论

m0_52541981 2021.07.21
#这里需要注意,github上面的代码有错误,需要添加if条件语句，训练才能正常运行。多亏了这句话，train.py一直报错，sample一直是空的，搞了一天。全网貌似就你这有这个提示，多谢！
- qq_58814081回复m0_52541981 2021.08.04
  我也是同样的问题，刚开始看博主源码没发现，多亏了您的评论，谢谢

superME1226 2021.03.09
您好，请问加载train.txt里面的图片路径后，总是前面会多一个绝对路径的前缀，这个绝对路径在哪删除呢？ OSError: [Errno 22] Invalid argument: 'E:\\eclipse-workspace\\PyTorch\\PyTorch-YOLOv3\\data\\cocoE:\\004 eclipse_workspace\\License Plate Detection\\PyTorch-YOLOv3\\data\\custom\\images\\46.jpg'

noworldling 2020.10.27
NameError: name 'parse_data_config' is not defined 这个错误怎么改啊

鼠拨土 2020.09.18
AttributeError: 'str' object has no attribute 'seek' AttributeError: 'str' object has no attribute 'read'，请问博主，test代码运行出现以上问题，该如何解决呢
- 汤姆瑞德尔回复鼠拨土 2021.08.26
  代码开始出没有保存
- qq_35916449回复qq_35916449 2020.12.22
  数据集.txt文件最后有空白行，删掉就可以了

brucefengfeng 2020.08.30
训练完后生成的文件在哪呢？怎么没见生成的文件呀？
- brucefengfeng回复奔跑熊 2020.09.02
  [reply]yongjiankuang[/reply]torch.save()保存的好像是每一次训练后的，训练几次就产生几个文件， if epoch % opt.checkpoint_interval == 0: torch.save(model.state_dict(), "checkpoints/yolov3_ckpt_%d.pth" % epoch) ，就是没找到最终的
- 奔跑熊回复brucefengfeng 2020.08.31
  [reply]brucefengfeng[/reply]你需要在训练的入口那个参数列表里设置默认路径，或者你在torch.save()里面设置具体的路径也行

sinat_41122907 2020.05.13
请问博主直知道怎么计算precision，recall么

hiphop_rapper 2020.04.17
谢谢博主,很到位

CHUNERnubi 2020.04.06
谢谢博主，您在test.py代码中的注释：“类别名称文本一定要空出一行，不然读到的类别会少一类从而报错。”很精髓，解决了我的问题，多谢您的帮助，感谢
- CHUNERnubi回复鼠拨土 2020.09.19
  不是这个错误
- 鼠拨土回复CHUNERnubi 2020.09.18
  true_positives, pred_scores, pred_labels = [np.concatenate(x, 0) for x in list(zip(*sample_metrics))] ValueError: not enough values to unpack (expected 3, got 0) 是这个错吗？

qq_39298094 2020.03.27
博主，在训练模型的时候报错RuntimeError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0; 6.00 GiB total capacity; 4.26 GiB already allocated; 60.63 MiB free; 27.12 MiB cached)崩溃啊。。。。。。
- qq_37859903回复qq_39298094 2020.04.06
  [reply]qq_39298094[/reply]显存不够改batch_size 之类的实在不行就换CPU运行