Action Recognition with Improved Trajectories
Abstract
最近,密集轨迹被证明是一种有效的动作识别视频表示方法,并在各种数据集上取得了最新的结果。本文通过考虑摄像机的运动来修正它们,从而提高了它们的性能。
为了估计相机的运动,我们使用SURF描述子和密集光流来匹配帧之间的特征点,这些特征点是互补的。然后,这些匹配被用来用RANSAC稳健地估计单应性。
人体运动通常不同于摄像机运动,会产生不一致的匹配。为了提高估计精度,采用了一种人体检测器来消除这些匹配。
给定估计的摄像机运动,我们移除与之一致的轨迹。我们也用这个估计来抵消光流中的相机运动。这显著改善了基于运动的描述符,如HOF和MBH。四个具有挑战性的动作数据集(Hollywood2、HMDB51、Olympic Sports和UCF50)的实验结果明显优于当前的技术水平。
Dense Trajectories
先简单介绍DT(Dense Trajectories)方法:利用光流场来获得视频序列中的轨迹,在沿着轨迹提取轨迹形状特征和HOF,HOG,MBH特征,然后利用BoF(Bag of Features)方法对特征进行编码,最后基于编码结果训练SVM分类器
密集采样
DT方法通过网格划分的方式在图片的多个尺度上分别密集采样特征点。在多个空间尺度上采样能保证采样的特征点覆盖了所有空间位置和尺度,