YOLOv3详解
论文地址:https://pjreddie.com/media/files/papers/YOLOv3.pdf
论文:YOLOv3: An Incremental Improvement
网络结构:
图源博客:https://www.jianshu.com/p/ab8392ef3394
YOLOv3输出三个尺度的检测,分别对应S、M、L三类目标的检测。如上图所示,输入图片的大小为416*416,输出的分别为(bs, 52, 52, 75)(bs, 26, 26, 75) (bs, 13, 13, 75)。
这里的75对应的计算过程为 75 = 3 * ( 20 + 1 + 4),20对应VOC数据集中20类被的概率,1表示锚框对应是前景还是背景,4对应锚框的坐标,3对应预先设定三个不同的锚框。
损失函数
- 中心坐标误差
- 宽高坐标误差
- 置信度误差
交叉熵函数
- 分类误差
具体分析可参考博客:https://blog.youkuaiyun.com/weixin_43384257/article/details/100986249