[论文笔记5]A Discriminatively Trained, Multiscale, Deformable Part Model

本文介绍物体检测模型的组成及特征应用,利用HOG特征进行物体位置确定,并通过Latent SVM进行优化,确保模型的准确性。同时,探讨了模型在HOG金字塔中的置放策略,以及如何通过挖掘负样本来提升检测效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.物体检测的模型组成:一个 global root filter 用来确定物体的位置(获取coarse features) 以及若干part model,包括spatial model 和 part filter(finer scale features)

2.特征:hog

一个block=2×2 cell = 4× 9(bins) = 36 D

所以一个filter的weight是:4×9×w*h

filter(w*h)在detect windows上的得分是filter与该特征在hog金字塔的subwindow(w*h)的点积


3.将model置于hog金字塔,假设每个part的hog cell 的size是root level 的一半

放置model的得分=每个filter的得分(数据相关项)+ 每个part相对于root(二次函数)的placement的得分(spatial term)

然而placement是指数级增长,2个技巧:动态规划,距离转换


4.latent svm 

hinge: max(0,1-yi*fbeta(xi)) 

当yi=-1 损失函数是关于负样本的凸函数

将正样本的latent domain限制为单一的选择,那么关于正样本也是凸的

使用坐标下降法:step1,固定beta(模型参数),优化正样本的隐变量Zi。。。step2,固定{Zi},优化beta,此时是凸优化问题


5.挖掘负样本

添加那些分错的,且靠近分割平面的负样本 hard instances,作者收集了所有的hard negatives

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值