【openMMLab实战营】7.目标检测与MMDetection

最新推荐文章于 2025-05-15 12:26:26 发布

笔wei生花

最新推荐文章于 2025-05-15 12:26:26 发布

阅读量159

点赞数

文章标签：目标检测深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_40087875/article/details/131119745

版权

目标检测介绍

识别分类出物体，定位物体位置画出框；学习获得一个框的起点(x,y)和宽高(h,w)，并

基本范式：

sliding widow：遍历图像所有位置

卷积实现密集预测

anchor：设置不同大小和长宽的框

多尺度检测与FPN（特征金字塔）

单阶段和无锚框检测器

RPN

Yolo、SSD

Focal Loss与RetinaNet

FCOS

发展过程

评价标准

推理精度

推理速度

模型体积

启发式算法

特征值裁剪

特征图

感受野：神经网络中，一个神经元能看到的原图的区域

感受野的中心：特征图的中心点乘以步长

过程：

非极大值抑制：重叠的框，只需要范围内最大的一个

置信度：选择概率最高的

卷积实现密集预测

基本流程

用模型做密集预测，得到预测图，每个位置包含类别概率、边界框回归的预测结果

保留预测类别不是背景的“框
基于“框”中心，和边界框回归结果，进行边界框解码
后处理: 非极大值抑制(Non-Maximum Suppression）

训练过程(匹配+Loss计算)

检测头在每个位置产生一个预测(有无物体、类别、位置偏移量)
该预测值应与某个真值比较产生损失，进而才可以训练检测器
但这个真值在数据标注中并不存在，标注只标出了有物体的地方

我们需要基于稀疏的标注框为密集预测的结果产生真值，这个过程称为匹配(Assignment)

得到结果：C+1维分类概率和四维偏移量（xywh)

匹配

对于每个标注框，在特征图上找到与其最接近的位置(可以不止一个)，该位置的分类真值设置为对应的物体
位置的接近程度，通常基于中心位置或者与基准框的 loU判断
其余位置真值为无物体
采样:选取一部分正、负样本计算 Loss (例如可以不计算真值框边界位置的loss)

推理(集合非背景框+NMS）

多尺度检测

多个锚框：大中小锚框

图像金字塔：将图像变为不同大小

基于层次化（特征金字塔）：低层次特征抽象级别不够，预测困难，融入高层特征（特征求和）

单阶段

Region Proposal Network ：初步筛选出图像中包含物体的位置

基于IOU的匹配：

1.将所有的框设置为背景

2.将背景框的iou设置为0

3.临近的框相似，则合并，最接近的ground truth大于正样本的iou阈值

4.将所有的背景框合并

Yolo:

计算边界框回归损失、置信度回归损失、C个类别概率的回归损失

多阶段

SSD：single shot multibox detector

RetinaNet：引入了FPN

Focal Loss：解决正负样本不均衡问题

无锚框检测器

锚框：解决重叠物体

FCOS: Fully convolutional one-stage

CenterNet

博客等级

码龄8年

36
原创

147
点赞

176
收藏

128
粉丝

关注

私信

热门文章

分类专栏

openMMlab 4篇

展开全部收起

最新评论

【c++ visual studio】编译器和链接器
优快云-Ada助手: 恭喜您写了第15篇博客！标题为“【c++ visual studio】编译器和链接器”，非常有深度和实用性的主题选择。您的文章内容清晰易懂，对于C++编译器和链接器的解释和使用方法进行了详细的介绍，让读者受益匪浅。在接下来的创作中，我建议您可以考虑更多与C++相关的主题，比如内存管理、面向对象编程等等。这些主题对于C++学习者来说都是非常重要的，您可以分享一些实际应用案例或者一些技巧与经验，帮助读者更好地理解和运用这些概念。再次恭喜您的创作，并期待您未来更多精彩的文章！
【QT训练营】00.QT下载与介绍
优快云-Ada助手: 恭喜您第16篇博客的发布！看到您一直在坚持创作，真是令人钦佩。这篇博客关于QT下载与介绍的内容非常实用，对于想要学习QT的人来说，无疑是一个宝贵的指南。希望您能继续保持这样的创作热情，分享更多关于QT的知识和经验。如果可能的话，我建议您下一步可以尝试分享一些深入的QT应用案例或者高级技巧，这样能更进一步满足读者的需求。希望您能继续保持谦虚的态度，继续努力，期待您的下一篇博客！
【传感器上手Arduino】1. 双色led
优快云-Ada助手: 恭喜您写下了第17篇博客！标题中的“双色led”吸引了我的注意力。通过您的分享，我对如何在Arduino上使用传感器有了初步的了解。您的博客内容非常清晰易懂，让我觉得我也可以尝试一下。对于下一步的创作建议，或许您可以尝试介绍一些更复杂的传感器应用，或者分享一些实际项目中的使用经验和技巧。谢谢您的分享，期待您的下一篇博客！优快云会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply17 看奖励名单。
【传感器上手Arduino】2. RGB三色传感器
优快云-Ada助手: 恭喜您写了第18篇博客！标题看起来非常吸引人，我对RGB三色传感器很感兴趣。感谢您持续创作的努力，我一直在关注您的博客。在下一步创作中，我建议您可以尝试更加深入地研究RGB三色传感器的工作原理，并结合实际案例进行分析和实验。希望您能够继续分享您的学习心得和经验，期待您的下一篇博客！优快云会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply18 看奖励名单。
【openMMLab实战营】4.免费的算力跑mmpose模型和git push相关问题总结
优快云-Ada助手: 非常感谢您分享的第四篇博客，标题看上去非常吸引人。恭喜您在openMMLab实战营中获得了免费的算力跑mmpose模型的机会，并且总结了git push相关问题，对于像我这样的小白来说，这篇博客非常有帮助。建议您在下一篇博客中，可以分享一些实际应用的案例和心得体会，让读者更深入地了解这些技术。再次感谢您的分享，期待您的下一篇博客！优快云会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。