*目标定位(Object localization)
*特征点检测(Landmark detection)
*目标检测(Object detection)
*卷积的滑动窗口实现
*YOLO算法
*非极大值抑制
*Anchor Boxes
一、目标定位(Object localization)

多个不同分类的对象。因此,图片分类的思路可以帮助学习分类定位,而对象定位的思路又有助于学习对象检测,我们先从分类和定位开始讲起。
分类定位:


目标标签?:

图片中没有检测对象的情况:

神经网络的损失函数:

二、特征点检测(Landmark detection)


标签训练集(人为辛苦标注 ):

三、目标检测(Object detection)
汽车检测:

滑动窗口目标检测算法:

总有一个窗口可以检测到汽车:

滑动窗口目标检测算法的缺点:

四、卷积的滑动窗口实现
4分类(行人、汽车、摩托车和背景):

卷积的滑动窗口实现:







五、YOLO算法

YOLO算法:


指定边界框:

六、非极大值抑制
交并比:

非极大值抑制:


非极大抑制是怎么起效的?:
我们分步介绍一下非极大抑制是怎么起效的,因为你要在361个格子上都运行一次图像检测和定位算法,那么可能很多格子都会举手说我的??,我这个格子里有车的概率很高,而不是361个格子中仅有两个格子会报告它们检测出一个对象。所以当你运行算法的时候,最后可能会对同一个对象做出多次检测,所以非极大值抑制做的就是清理这些检测结果。这样一辆车只检测一次,而不是每辆车都触发多次检测。
所以这就是非极大值抑制,非最大值意味着你只输出概率最大的分类结果,但抑制很接近,但不是最大的其他预测结果,所以这方法叫做非极大值抑制。



七、Anchor Boxes


训练:

预测:



博客围绕目标检测展开,介绍了目标定位、特征点检测、目标检测等概念,阐述了卷积的滑动窗口实现、YOLO算法、非极大值抑制、Anchor Boxes等技术。其中,非极大值抑制可清理检测结果,避免对同一对象多次检测。
556

被折叠的 条评论
为什么被折叠?



