行为识别笔记：improved dense trajectories算法（iDT算法）

最新推荐文章于 2025-01-14 20:55:36 发布

Will-Lin

最新推荐文章于 2025-01-14 20:55:36 发布

阅读量5.4w

点赞数 37

分类专栏：计算机视觉文章标签：算法计算机视觉行为识别

本文链接：https://blog.youkuaiyun.com/wzmsltw/article/details/53023363

版权

本文详细介绍了行为识别领域的经典算法——improved dense trajectories (iDT)。iDT在深度学习广泛应用前是最佳算法，通过相机运动估计、特征归一化和Fisher Vector编码等方式提升了密集轨迹（DT）算法的效果。文章涵盖了DT的基本框架、特征提取、iDT的改进点，以及在行为识别中的应用，展示了iDT如何通过消除背景光流干扰和优化特征编码提高准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

转发请注明出处：http://blog.youkuaiyun.com/wzmsltw/article/details/53023363

iDT算法是行为识别领域中非常经典的一种算法，在深度学习应用于该领域前也是效果最好的算法。由INRIA的IEAR实验室于2013年发表于ICCV。目前基于深度学习的行为识别算法效果已经超过了iDT算法，但与iDT的结果做ensemble总还是能获得一些提升。所以这几年好多论文的最优效果都是“Our method+iDT”的形式。

此前由于项目原因，对iDT算法进行了很多研究和实验，故此处对其核心思路与一些实施的细节进行总结，方便后续回顾，也希望能够在此过程中获得一些新的启发。

介绍的内容主要包含两篇文章的内容，分别是”Dense Trajectories and Motion Boundary Descriptors for Action Recognition”和”Action Recognition with Improved Trajectories”。这两篇都是H. Wang的文章，前者要更早一些，介绍了DT（Dense Trajectories）算法。后者则在前者的基础上进行了改进（improved），主要是引入了对背景光流的消除方法，使得特征更集中于对人的运动的描述。两者的框架大致相同，本文先对DT算法进行介绍，再介绍iDT算法的改进之处。

iDT的代码可以在其个人主页上下到，也可以点击此处下载。

对iDT特征进行FV编码的代码可以在dtfv 下载。

更新了iDT算法的代码解析，见iDT算法用法与代码解析