视频自监督二. VTDL: 时序Discriminative
paper
鉴于目前视频自监督大多数文章不开放代码/开放代码也不能复现的怪象, 我们开源了自己的代码,包括Logs/Trained Model
code
延续着之前视频自监督一中Intra-video Mixup 的工作,我们把这种augmentation的思想继续拓展了一下,提出了一个新的VTDL框架。在视频自监督中做到了很高的效果。

Pipeline
Time derivative 是传统行为识别中非常重要的measurement, 我们想让网络也保持对derivative的敏感性,具体实现如下:


最终的TCA具