基于可识别训练的部件模型的目标检测
Object Detection with Discriminatively Trained Part Based Models
摘要
基于多尺度可变形的部件模型我们来描述一个目标检测系统。我们的系统能够表示高度可变的对象类并在PASCAL目标检测挑战达到最先进的结果。虽然可变形部件模型变得十分流行,但是它们的值至今没有在诸如PASCAL数据库这种困难的基准上证明。对于可区分训练,我们的系统依赖于使用部分标记的数据这种新方法。我们结合了一种对数据挖掘反例的高灵敏度的方法,使用一种我们称之为潜在支持向量机的形式。潜在的支持向量机是一种基于潜在变量的MI-SVM的重新生成。一个潜在的支持向量机是半凸的,一旦潜在的信息指定为正面例子,训练问题就会变成凸形。这就引出了一种迭代训练算法,该算法可以在为正例修正潜在值和优化潜在的SVM目标函数之间进行交替。。
目的:检测目标并给定类别考虑从静态图像中的人或汽车等类别检测和定位一般对象的问题。
难点:视角变化、光照因素、非刚性的形变、类内形变等。
多尺度可变形部件模型使用一个可区分的程序进行训练,仅需要一系列图像中目标的边界框。结果非常高效,在PASCAL VOC基准和INRIA行人数据集取得最好的效果。
图形结构框架
图形结构通过一个可变形配置中排列的部分集合来表示对象。每个部分都捕获一个对象的局部外观属性,而可变形的配置则以某些对部分之间的弹簧式连接为特征。
可变形模型抓取表面有意义的变量,可是单一的可变形模型在图像出现多个目标时表现得不够好。解决:混合模型处理多个有意义的变量信息
视觉语法
视觉语法是基于可变形模型的推广,用变量等级结构表示目标。基于模型中的语法的每一部分都能直接或间接被其他部分表示。模型间能共享不同类的信息。
简单的模型能够在实际中效果优于复杂的模型,因为后者在训练期间存在困难。对于目标检测来说,精确的模板和特征袋模型可以容易的使用SVM这样的可区分的方法实现。更丰富的模型却是比较难训练的,尤其是因为他们经常利用潜在的信息。因为部分未被标记,所以视为潜在的信息,但是利用标记的部分信息又会出现较差的训练结果(一旦标记的是次优的部分) 自动部分标记
DPM(Deformable Part Model,可变形部件模型)
DPM,一种基于组件的检测方法。该模型是由Felzenszwalb在2008年提出,以下是算法思想:
(1)Root filter+ Part filter
该模型包含了一个8*8分辨率的根滤波器(Root filter)(左)和4*4分辨率的组件滤