Darknet 输出网络结构详解

本文详细解读了YOLOv3深度学习框架中的各层功能,包括卷积层(conv)、shortcut层(res)、YOLO层(yolo)、融合层(route)和上采样层(upsample),并解释了各层的关键参数,如过滤器(filters)、大小(size)、输入(input)和输出(output)等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

先来张图
在这里插入图片描述

一、各列说明

1. layer

这一列顾名思义,是层名称。
数字是层编号,后面是层名称。
conv:卷积层。
res:shortcut层(跨层连接,借鉴 resnet 而来,所以用res表示)
yolo:YOLO层。
route:融合层,就是把层进行合并,然后输出到下一层。(后面再仔细讲)
upsample:上采样层。

2. filters

这是对于 conv 来说的,代表过滤器的通道数,和后面 output 的通道数是一致的。
(上述的过滤器和常说的卷积核是一样的东西,就是卷积运算的那个动函数)
这一列中对应非 conv 层的数字在后面讲解各层时再说明。

3. size

这一列和 filters 一样,也是只对于 conv 来说的,代表过滤器的大小和步长。
如:3 x 3 / 1,代表过滤器大小为 3*3,步长为 1。

4. input

这一层的输入,416 x 416 x 3,代表输入大小为 416 x 416,通道数为 3。

5. output

这一层的输出,416 x 416 x 32,代表输入大小为 416 x 416,通道数为 32。

6. 最后一列

不知道什么意思。。。知道了再补。
如果有大佬知道,非常感谢在评论区留言。
某次卷积运算需要多少个十亿次浮点运算,其全称是 billion float operations,将多次卷积运算所耗费的BLOPS加起来就可以表示某个算法模型的时间复杂度。
总之,就是衡量这层卷积的性能的指标,可以看到只有 conv 层后面才有这个参数。
参考1参考2
感谢评论区 AllenLIL 的提醒。
(2020.8.22)

二、各行说明

1. conv

卷积层, 用过滤器(卷积核)对输入做卷积。

2. res

shortcut 层,是卷积的跨层连接,本层的输入与输出一般保持一致,并且不进行其他操作,只是求差。
后面的数字代表把那一层的输出作为本层的输入,如下图。
在这里插入图片描述

3. yolo

做 yolo 运算,还不太明白,再补。

4. route

融合层,就是把层进行合并,然后输出到下一层。
在这里插入图片描述
如11层,代表将第9层与第3层的输出相加,作为本层的输出,即下一层的输入。
相加规则为:如第3层的输出为208 x 208 x 64,第9层的输出为208 x 208 x 256,则本层输出为208 x 208 x (64+256) 即 208 x 208 x 320,所以route的两层的 weight 和 height 必须相等,若不相等,则本层输出为 0 x 0 x 0,下一层得不到有效输入,就会报 Layer before convolutional must output image. 然后停止。

5. upsample

在这里插入图片描述
上采样层,如第10层,后面的 2x,是2倍上采样的意思。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

万俟淋曦

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值