【论文笔记】TAM: Temporal Adaptive Module for Video Recognition
正如我们在第一节中所讨论的,**视频数据通常表现出由摄像机运动和速度变化等因素引起的复杂的时间动态。**因此,与3D CNN中的共享卷积核不同,我们旨在通过引入具有视频特定内核的时间自适应模块( TAM )来解决这个问题。提出的TAM以灵活高效的方式基于视频特征生成动态时间核,从而能够根据运动内容自适应地聚合时间信息。TAM易于集成在现有的2D CNNs (例如, ResNet)中生成视频网络架构,如图2所示。我们将对TAM进行概述,然后描述其技术细节。我们还讨论了我们的TAM与现有工作的关系。
原创
2023-08-24 19:43:51 ·
1904 阅读 ·
0 评论