目标检测
用矩形框框出感兴趣的物体同时预测物体类别。
应用方面:
- 人脸识别:身份识别、属性分析等。
- 智慧城市:垃圾检测、非法占道违章停车检测、确保环境安全等。
- 自动驾驶:环境感知、路径规划与控制。
- 下游视觉任务:检测文字出现的区域以供识别、检测出人体以供姿态估计。
与图像分类比较
目标检测的物体数量、位置、大小都不固定。但需要算法理解图像的内容,通过深度神经网络实现。
思路
通过滑窗sliding windows遍历图像所有位置,所到之处用分类模型识别窗口内容(矩形框)
缺点:单张图片就已需要大量windows,若使用不同大小的windows,分类次数又会成倍增加带来不可接受的计算成本。
改进思路1:使用启发式算法替换暴力遍历 例如 R-CNN,Fast R-CNN 中使用 Selective Search 产生提议框。但依赖外部算法,系统实现复杂,难以联合优化性能。
- 区域提议 于图像颜色或底层特征,找出可能含有物体 的区域,再送给神经网络识别。相比于普通滑窗,减少框的个数且保证召回率。
- eg:Selective Search算法流程:基于贪心算法,将空间相邻、特侦相似的图像块足部合并到一块。

改进思路2:减少冗余计算,使用卷积网络实现密集预测(目前普遍采用的方式)。
- 分析滑窗中的重复计算并且消除。
- 方式:用卷积一

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



