
深度学习
一杯咖啡Miracle
图像识别算法工程师
展开
-
论文阅读:AdaFuse: Adaptive Temporal Fusion Network for Efficient Action Recognition - ICLR2021
文章提出了一种称为 AdaFuse 的自适应时间融合网络,它动态地融合来自当前和过去特征图的通道,以进行强大的时间建模。该方法在必要时重用历史特征(即,动态决定每个层和每个实例保留、重用或跳过哪些通道),目的是提高识别率和效率。该方法可以作为插件操作用于各种基于 2D CNN 的动作识别架构。该方法的概念图如下:对于历史特征图和当前特征图,先通过全局平均池化得到特征向量,然后将特征向量输入预测网络,预测网络输出结果pt取值如下:pt=0代表将特征图保留(即进行正常卷积操作);pt=1代表重.原创 2022-03-15 16:01:25 · 4759 阅读 · 0 评论 -
论文阅读:A3D Adaptive 3D Networks for Video Action Recognition-CVPR2020
论文地址:https://arxiv.org/pdf/2011.12384v1.pdf文章介绍了 A3D,这是一种自适应 3D 网络,可以通过一次性训练在广泛的计算约束下进行推断。它不是以网格搜索方式训练多个模型,而是通过在网络宽度和时空分辨率之间进行权衡来生成良好的配置。论文提出了子网络与全网络相互训练的方式,即时空蒸馏策略,以促进不同网络配置之间的知识转移。网络主干采用SlowFast,通过对网络宽度系数和时空分辨率因子在一定范围内随机采样,组合出多种训练配置,通过多路径权衡和自..原创 2022-03-10 21:50:32 · 264 阅读 · 0 评论