什么是目标检测
给定一张图片,用矩形框框出所有感兴趣物体 同时预测物体类别。
目标检测的应用
- 目标检测 in 人脸识别
- 目标检测 in 智慧城市
- 目标检测 in 自动驾驶
- 目标检测 in 下游视觉任务
- 目标检测 vs 图像分类
目标检测 vs 图像分类
滑窗 Sliding Window
-
设定一个固定大小的窗口
-
遍历图像所有位置,所到之处用分类模型(假设已经训练好)识别窗口中的内容
-
为了检测不同大小、不同形状的物体,可以使用不同大小、长宽比的窗口扫描图
改进思路
-
区域提议:基于图像颜色或底层特征,找出可能含有物体 的区域,再送给神经网络识别。相比于普通滑窗,减少框的个数且保证召回率。
-
消除滑窗中的重复计算:用卷积一次性计算所有特征,再取出对应位置的特征完成分类。
目标检测的基本范式
- 两阶段方法:(基于区域的方法) 以某种方式产生窗,再基于窗口内的特征进行预测
- 单阶段方法:在特征图上基于单点特征实现密集预测
目标检测技术的演进