2.6
目标检测

使用固定大小的窗口,将图片进行遍历,将图像反馈给卷积网络,进行识别,但是滑窗检测平均一个图像需要进行1200个窗口分类,所以效率低,还会重复计算。可以采用启发式算法替换暴力遍历
基础知识
框泛指图像上的矩形框,边界横平竖直
描述一个框需要 4 个像素值:
• 方式1:左上右下边界坐标 𝑙,𝑡, 𝑟, 𝑏
• 方式2:中心坐标和框的长宽 𝑥, 𝑦, 𝑤, ℎ
边界框通常指紧密包围感兴趣物体的框
检测任务要求为图中出现的每个物体预测一个边界框
1. 区域(Region):框的同义词
2. 区域提议(Region Proposal,Proposal):指算法预测的可能包含物体的框,某种识别能力不强的算法的初步预测结果
3. 感兴趣区域(Region of Interest,RoI)
当我们谈论需要进一步检测这个框中是否有物体时,通常称框为感兴趣区域
4. 锚框(Anchor Box,Anchor)
图中预设的一系列基准框,类似滑窗,一些检测算法会基于锚框预测边界框
交并比
为两矩形框交集面积与并集面积之比,是矩形框重合程度的衡量指标

置信度
置信度(Confidence Score):模型认可自身预测结果的程度,通常需要为每个框预测一个置信度
在滑窗或其他方法产生的框中,与物体的边界通常会有所偏差,则可以在预测物体类别的时候同时预测边界框相对于滑窗的偏移量

ppt 链接:https://pan.baidu.com/s/1vOKQ175HibjeOsjfBbVMhA?pwd=xa1n
提取码:xa1n