pytorch yolov3 代码详解_超详细的Pytorch版yolov3代码中文注释详解（一）

最新推荐文章于 2023-01-23 09:46:38 发布

weixin_39893893

最新推荐文章于 2023-01-23 09:46:38 发布

阅读量1.3k

点赞数

文章标签： pytorch yolov3 代码详解

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_39893893/article/details/111792974

版权

本文详细介绍了如何在PyTorch中实现YOLOv3检测模型，包括从配置文件解析、构建网络模块、到前向传播过程的代码解读，以及权重加载的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

from __future__ import division

import torch

import torch.nn as nn

import torch.nn.functional as F

from torch.autograd import Variable

import numpy as np

from util import *

def get_test_input():

img = cv2.imread("dog-cycle-car.png")

img = cv2.resize(img, (416,416)) #Resize to the input dimension

img_ = img[:,:,::-1].transpose((2,0,1)) #img是【h,w,channel】，这里的img[:,:,::-1]是将第三个维度channel从opencv的BGR转化为pytorch的RGB，然后transpose((2,0,1))的意思是将[height,width,channel]->[channel,height,width]

img_ = img_[np.newaxis,:,:,:]/255.0 #Add a channel at 0 (for batch) | Normalise

img_ = torch.from_numpy(img_).float() #Convert to float

img_ = Variable(img_) # Convert to Variable

return img_

def parse_cfg(cfgfile):

"""输入: 配置文件路径返回值: 列表对象,其中每一个元素为一个字典类型对应于一个要建立的神经网络模块(层)"""

# 加载文件并过滤掉文本中多余内容

file = open(cfgfile, 'r')

lines = file.read().split('\n') # store the lines in a list等价于readlines

lines = [x for x in lines if len(x) > 0] # 去掉空行

lines = [x for x in lines if x[0] != '#'] # 去掉以#开头的注释行

lines = [x.rstrip().lstrip() for x in lines] # 去掉左右两边的空格(rstricp是去掉右边的空格，lstrip是去掉左边的空格)

# cfg文件中的每个块用[]括起来最后组成一个列表，一个block存储一个块的内容，即每个层用一个字典block存储。

block = {}

blocks = []

for line in lines:

if line[0] == "[": # 这是cfg文件中一个层(块)的开始

if len(block) != 0: # 如果块内已经存了信息, 说明是上一个块的信息还没有保存

blocks.append(block) # 那么这个块(字典)加入到blocks列表中去

block = {} # 覆盖掉已存储的block,新建一个空白块存储描述下一个块的信息(block是字典)

block["type"] = line[1:-1].rstrip() # 把cfg的[]中的块名作为键type的值

else:

key,value = line.split("=") #按等号分割

block[key.rstrip()] = value.lstrip()#左边是key(去掉右空格)，右边是value(去掉左空格)，形成一个block字典的键值对

blocks.append(block) # 退出循环，将最后一个未加入的block加进去

# print('\n\n'.join([repr(x) for x in blocks]))

return blocks

# 配置文件定义了6种不同type

# 'net': 相当于超参数,网络全局配置的相关参数

# {'convolutional', 'net', 'route', 'shortcut', 'upsample', 'yolo'}

# cfg = parse_cfg("cfg/yolov3.cfg")

# print(cfg)

class EmptyLayer(nn.Module):

"""为shortcut layer / route layer 准备, 具体功能不在此实现，在Darknet类的forward函数中有体现"""

def __init__(self):

super(EmptyLayer, self).__init__()

class DetectionLayer(nn.Module):

'''yolo 检测层的具体实现, 在特征图上使用锚点预测目标区域和类别, 功能函数在predict_transform中'''

def __init__(self, anchors):

super(DetectionLayer, self).__init__()

self.anchor

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。