OpenMMlab《目标检测与MMDetection》听课笔记

目标检测是计算机视觉领域的一个重要技术,它在一张图片中不仅能识别出物体,还能定位物体的位置。通过滑窗技术或区域提议方法减少计算量,结合卷积神经网络进行特征提取和分类。两阶段方法先生成区域提议再进行预测,而单阶段方法则直接进行密集预测。这项技术广泛应用在人脸识别、智慧城市、自动驾驶等多个领域。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

什么是目标检测

        给定一张图片,用矩形框框出所有感兴趣物体 同时预测物体类别。

目标检测的应用

  1. 目标检测 in 人脸识别
  2. 目标检测 in 智慧城市
  3. 目标检测 in 自动驾驶
  4. 目标检测 in 下游视觉任务
  5. 目标检测 vs 图像分类

目标检测 vs 图像分类

滑窗 Sliding Window

  1. 设定一个固定大小的窗口

  2. 遍历图像所有位置,所到之处用分类模型(假设已经训练好)识别窗口中的内容

  3. 为了检测不同大小、不同形状的物体,可以使用不同大小、长宽比的窗口扫描图

改进思路

  1. 区域提议:基于图像颜色或底层特征,找出可能含有物体 的区域,再送给神经网络识别。相比于普通滑窗,减少框的个数且保证召回率。

  1. 消除滑窗中的重复计算:用卷积一次性计算所有特征,再取出对应位置的特征完成分类。

 

目标检测的基本范式

  1. 两阶段方法:(基于区域的方法) 以某种方式产生窗,再基于窗口内的特征进行预测 
  2. 单阶段方法:在特征图上基于单点特征实现密集预测

目标检测技术的演进

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值