思路
论文参考:You only look once unified real-time object detection

- 输入图片 resize 4484483
- 将图片分成7*7 的网格
- 经过Googlenet 提取图片特征
- 经过全联接层
- 最后输出7730(每个网格预测5520个类别的概率)
- 进行非极大值抑制
细节
confidences 计算
c=Pr(Object)∗IOU pred-truth
Pr(Object)表示当前格子包含目标的概率,如果检测到另一个物体的confidences 很大, 则另一个设置为0, 所以只能检测出一个物体。
-
非极大值抑制
本文详细介绍了Yolo系列目标检测算法,从基本思路开始,包括输入图片处理、网格划分、特征提取、非极大值抑制等步骤。Yolov2通过引入batch normalization和k-means设定先验框,提升了检测效果。Yolov3通过多尺度特征融合,增强了对不同大小物体的检测能力。而Yolov4则进一步增加了数据多样性,并采用dropblock和标签平滑等技术优化算法。
订阅专栏 解锁全文
3951

被折叠的 条评论
为什么被折叠?



