AI实战训练营(Class 6)目标检测与MMDetection
目标检测的基本范式
目标检测 vs 图像分类
目标检测技术的演进
框,边界框
描述一个框需要四个像素值,有两种方式:
- 左上右下坐标(l,t,r,b)
- 中心坐标和边框的长宽(x,y,w,h)
评价边界框的好坏:交并比(IoU)
交并比(IoU)定义了两个矩形框的交集面积与并集面积之比,是矩形框重合度的h衡量指标。
目标检测的基本思路
滑窗
通过固定大小的窗口对整个图像进行滑动遍历,并对窗口中的图像进行评估,以获得评价高的窗口。
为了检测不同大小、不同形状的物体,可以使用不同大小,不同长宽比的窗口扫描图片。
密集预测基本范式
通过主干网络对对图像提取特征,再由检测头对特征图进行预测,从而减少计算量。
但这种方法对于小目标效果不好,一种解决办法是特征金字塔:
在主干网络卷积的不同层的特征图进行检测头预测,可以有效地对小目标进行预测。
无锚框目标检测算法
无锚框 vs 有锚框