(202302)OpenMMLabAI实战营CV肆——目标检测简介与基础知识

目标检测

用矩形框框出感兴趣的物体同时预测物体类别。

应用方面:

  • 人脸识别:身份识别、属性分析等。
  • 智慧城市:垃圾检测、非法占道违章停车检测、确保环境安全等。
  • 自动驾驶:环境感知、路径规划与控制。
  • 下游视觉任务:检测文字出现的区域以供识别、检测出人体以供姿态估计。

与图像分类比较

目标检测的物体数量、位置、大小都不固定。但需要算法理解图像的内容,通过深度神经网络实现。

思路

通过滑窗sliding windows遍历图像所有位置,所到之处用分类模型识别窗口内容(矩形框)

缺点:单张图片就已需要大量windows,若使用不同大小的windows,分类次数又会成倍增加带来不可接受的计算成本。

改进思路1:使用启发式算法替换暴力遍历 例如 R-CNN,Fast R-CNN 中使用 Selective Search 产生提议框。但依赖外部算法,系统实现复杂,难以联合优化性能。

  • 区域提议 于图像颜色或底层特征,找出可能含有物体 的区域,再送给神经网络识别。相比于普通滑窗,减少框的个数且保证召回率。
  • eg:Selective Search算法流程:基于贪心算法,将空间相邻、特侦相似的图像块足部合并到一块。
  • 请添加图片描述

改进思路2:减少冗余计算,使用卷积网络实现密集预测(目前普遍采用的方式)。

  • 分析滑窗中的重复计算并且消除。
  • 方式:用卷积一
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

早上真好

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值