spatio-temporal localization方法

前言: 光流,backbone等等这种的发展就不说了,主要说下大的发展的变化

  1. 早期是单帧检测,然后把结果连接起来。
    不同方法backbone不同,有的也用了光流,比如[1]

  2. 由于单帧缺少对时序信息的挖掘,最近的方法是在做检测时用到时间信息。
    代表性的有

  • 1>ACT [2] 将多帧结果堆叠回归一个立方的proposal也就是说类似于做了proposal层面的tube(作者把它叫做tublet),然后把多个立方的proposal用dp算法做连接,平滑等后处理(作者叫spatio-temporal tubes)
  • 2> 上面都是2D卷积做的,T-CNN [3] 用了3D卷积提取clip的特征,然后经过作者提出的tube proposal 层来做clip内proposal的tube的构成,接着也是类似于1>进行后处理,构造spatio-temporal tubes
  • 3> AVA的baseline用了与1> 2>相似的pipeline。用了更强的backbone,同时proposal tube的生成方式是直接通过clip中间帧的proposal在clip内扩展得到,相比于单帧检测会更加高效。2>是通过不断地对提取器最后一层,3D的特征下采样到时间维度为1来进行检测,然后把这个proposal当作mask在提取器的前面没有做时间下采样前的特征处理,得到的proposal tubes。
  1. 后面的工作几乎都遵循2.里描述的pipeline,值得注意的是STEP [4] 在ucf101上取得了远超ACT和T-CNN的效果。它是用了cascade的策略,但是每次迭代时候会在时间维度对proposal进行扩展。

  2. 结论:感觉这个任务的尴尬程度不亚于caption

[1] G. Gkioxari and J. Malik. Finding action tubes. In CVPR, 2015. 3
[2] V.Kalogeiton, P. Weinzaepfel, V. Ferrari, and C. Schmid. Action tubelet detector for spatio-temporal action localization. In ICCV, 2017. 2, 3, 6, 7
[3] R. Hou, C. Chen, and M. Shah. Tube convolutional neural network (T-CNN) for action detection in videos. In ICCV, 2017. 2, 3, 6, 7
[4] Yang X, Yang X, Liu M Y, et al. STEP: Spatio-Temporal Progressive Learning for Video Action Detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2019: 264-272.

时空动作检测(spatio-temporal action detection)是一项计算机视觉任务,旨在从视频片段中准确地检测和识别出发生的动作。与传统的动作识别任务相比,时空动作检测旨在通过不仅仅检测动作在空间上的出现,还要捕捉动作在时间上的变化。 时空动作检测往往涉及以下几个主要步骤: 1. 帧级特征提取:首先,利用现有的特征提取技术,从每个视频帧中提取稳定而有信息量的特征,以捕捉空间信息。 2. 时间建模:接下来,通过对连续帧之间的变化进行建模,来捕捉动作的时间相关性和动态信息。这可以通过各种技术,如光流,差分图和循环网络等来实现。 3. 动作检测:在获得空间和时间特征后,利用学习算法(如深度神经网络)来进行动作检测。这通常通过将时空特征输入到分类器,然后根据预先训练的模型推断动作类别和位置。 4. 时空定位:最后,定位动作在视频中的准确位置。这可以通过在时间上进行滑窗检测,并使用非极大值抑制来抑制重叠检测结果来实现。 时空动作检测在很多领域具有广泛应用,比如视频监控、智能交通、运动分析和人机交互等。通过准确地检测和识别动作,我们可以实现更精确的行为理解和动作预测,从而为许多实际应用带来便捷和效益。然而,时空动作检测仍然存在一些挑战,如动作遮挡、背景干扰和不同尺度的动作等问题,所以该领域的研究仍在不断发展和进步。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值