【代码阅读】YOLOv3 Loss构建详解

最新推荐文章于 2025-10-14 20:57:46 发布

原创

最新推荐文章于 2025-10-14 20:57:46 发布 · 1.5w 阅读

75 ·

CC 4.0 BY-SA版权

文章标签：

#YOLO #CV #目标检测 #CNN

本文深入探讨YOLOv3的损失函数构建，详细解释网络输出与损失函数的关系，包括真值处理、位置和尺寸偏差计算、置信度损失等，帮助理解目标检测网络的工作原理。

Yolov3

YOLOv3 是YOLO系列目前最新的网络结构，YOLO系列可以说是打破了以FasterRCNN为例的two-stage框架的一统天下的局面。已经有很多博文介绍了YOLOv3的网络结构和思路，github上也有很多开源代码，这里我推荐一个Pytorch的实现和自己写的一个用于车牌检测的实现。
但对于一个神经网络来说，另一个重要的部分是Loss的构建。大多数文章关注于网络框架的搭建，忽略了Loss构建，使得读完之后虽然知道了网络的输出，但不知道这些输出到底对应着什么，从而很难理解网络具体的含义。本文就详细阐述YOLOV3的Loss的构建

网络框架

要讲Loss，就不得不讲网络的输出，这里我们略讲一下。具体可以参考yolo系列之yolo v3【深度解析】 yolo_framework

图1 YOLOv3 ssp 网络框架

可以看到，YOLOv3的输出是有3个：y1，y2，y3。分别对应不同的分辨率的feature map。

Loss构建

首先理解一下网络的输出。以y1为例，y1的输出为13*13*255，表示整张图被分为13*13个格子，每个格子预测3个框，每个框的预测信息

最低0.47元/天解锁文章

24 条评论

樱成冢丶 2020.05.10
然后加权得到总的Loss，如何加权表示

yangmin1 2020.03.24
CrossEntropyLoss用于多类别分类，yolov3没有用多类别分类，用的是多标签二分类吧？
- 麒麒哈尔回复yangmin1 2020.03.24
  [reply]yangmin1[/reply]Yolov3为什么没有多分类，COCO的80个类就是多分类啊

yangmin1 2020.03.24
logitsloss不是用来分类吗class loss？怎样用在框置信度object confidence？

「已注销」 2020.02.28
博主太棒了可，爱你！
- 麒麒哈尔回复「已注销」 2020.02.28
  你是谁了[face]monkey:0.gif[/face]

yjyjjyjy1231 2020.02.26
博主画的图好好看啊，是怎么画的呀
- 麒麒哈尔回复yjyjjyjy1231 2020.02.26
  [reply]qq_39055818[/reply]Stupid Girl

yuki___ 2019.12.10
你好我又有一个问题想请教一下，我现在需要让一个bbox与该张图上所有的groudtruth算IOU，即IOU(bbox(1,4), gth(n,4))。在branch size等于1的时候还好办但是branch size等于32时，n就是32张图总共的groundtruth，用我刚才那条命令会与其他图的groundtruth计算iou。我该怎么办啊T.T
- yuki___回复麒麒哈尔 2019.12.10
  [reply]wqwqqwqw1231[/reply] 谢谢指点！我去好好读下那里的代码，我直接用的原loss里算IOU_loss(lbox)的时候输入的gth和bbox那里没有图片的编号信息。
- 麒麒哈尔回复yuki___ 2019.12.10
  [reply]yuki___[/reply] 代码用的一样的，不好意思，我记错了，有batch信息的是FasterRCNN。你的gth是哪里来的，在utils/dataset.py的498行显示，在构造target时，加入了batch信息的。
- yuki___回复麒麒哈尔 2019.12.10
  [reply]wqwqqwqw1231[/reply] 你用的哪个版本的pytorch实现，我用的https://github.com/ultralytics/yolov3。我没有修改IOU的接口因为我print gth.shape的时候发现他是一个二维（n,4）没有i来给出第几张图片的信息
- 麒麒哈尔回复yuki___ 2019.12.10
  [reply]yuki___[/reply] 不知道IOU函数是不是你自己写的，如果是的话可以修改一下接口啊，改成IOU(bbox(1, 4), gth(i, n, 4))，i代表bbox所处的batch的位置。在我参考的代码中，bbox中是专门加入了batch的信息的，这个加入的过程你也可以参考一下。

Catcat1998的博客 2019.11.02
你好，得到了每个feature map上的loss,中的loss是怎么往回传的呢
- 麒麒哈尔回复Catcat1998的博客 2019.12.10
  [reply]weixin_42374905[/reply] 代码实现在pytorch中就是loss.backward()啊，自动计算梯度。
- Catcat1998的博客回复Catcat1998的博客 2019.11.08
  [reply]weixin_42374905[/reply] 我看过pytorch的loss回传是三个yolo层加和往回传的，说的是代码实现
- 麒麒哈尔回复Catcat1998的博客 2019.11.08
  [reply]weixin_42374905[/reply] 你是说在代码实现还是具体的原理？
- Catcat1998的博客回复Catcat1998的博客 2019.11.02
  [reply]weixin_42374905[/reply] 总的loss

yuki___ 2019.10.27
楼主你好，我不太明白如果用groudtruth与anchor IOU的阈值来决定某个框是否在这层featuremap上进行预测，会不会出现一个groundtruth在多层featuremap上被预测或者，没有featuremap负责预测某个groudtruth的情况？这两个情况发生了是怎么处理的？
- zzzzyf回复yuki___ 2020.05.26
  [reply]yuki___[/reply]源码上面，如果所有anchor都小于IOU阈值，那么将会使用这最大的IOU进行预测
- yuki___回复麒麒哈尔 2019.11.05
  [reply]wqwqqwqw1231[/reply] 谢谢！
- 麒麒哈尔回复yuki___ 2019.10.28
  [reply]yuki___[/reply] 会出现groundtruth在多层feature map上预测，这样子多层有输出，最后通过NMS进行抑制。应该不太会出现没有feature map预测groundtruth的情况，这样子的情况出现意味着anchor设置的太不合理，但我认为这种情况理论上是存在的。