Action Recognition with Improved Trajectories(2013)
本文是DT的升级版
主要贡献
1.提出一种去除相机运动产生的轨迹的方法
2.提出对人占屏比大的帧采用DPM进行行人检测,去除人的部分,再做相机运动估计。
(这两点都是用于对计算的轨迹进行优化,降低算法以外的因素带来的影响)
如图所示,第一排是两个连续帧叠加在一起,第二排是直接进行光流估计,第三排是去除了相机运动后的光流估计,第四排中白色的箭头是相机运动产生的trajectories。
Camera motioin estimation
第一步,假设两个连续的帧是同域(homography)的,(homography这里直接翻译是同域的意思,在论文里指的是两帧的差别不大,物体运动很小,例如连续两帧中的天空,基本都是一样的,那这两帧就属于homography)
第二步,使用SURF特征(SIFT的快速版,也是升级版)和光流估计来匹配特征点对,其中,SURF更注重区域块,在前面的文章《使用增强运动向量CNNs的实时行为识别》中提到光流是基于像素的,因此这两种方法是互补的,结合使用效果更好。之所以使用SURF是因为它对于运动模糊和旋转的图像有较好的鲁棒性(但不善于