res3D18

论文介绍了基于C3D和Deep Residual Learning的3D残差网络Res3D18。模型设计考虑了不同输入分辨率、采样间隔和网络深度对性能的影响。实验表明,在保持参数数量不变的情况下,18层的Res3D18表现良好,特别是在使用Sport-1M数据库时。相比于不带LSTM的方法,Res3D18效果更优,仅略逊于使用平均池化的LSTM模型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

该论文借鉴了C3D和何凯明等人的经典论文Deep Residual Learning for Image Recognition,CPVR,2016.
设计出来的可以称之为3D残差网络。具体模型如下图:
在这里插入图片描述
最终采用的是18层的。
下图通过将3D变成2D,得到3D比2D好。
在这里插入图片描述
模型的输入为8×112×112. 在需要下采样的卷积层之中,除了第一个的步长是1×2×2,其余的都是2×2×2.
该论文通过一些列的观察,得出18层的就够了,前提条件是在保持模型总参数不变的情况之下。
训练细节如下:
在这里插入图片描述
采样间隔讨论如下
间隔分为1,2,4,8,16,32. 为1的话,表明连续取4幅图片(调参的时候采用ucf101,输入是4×112×112,模型参数确定好以后,输入变成8×112×112),为32,表示是从128幅图像里面每间隔32选取1幅图像,实验结果如下在这里插入图片描述
输入图像分辨率的讨论
分224×224,112×112和56×56,分别从256×342,128×171和64×86中剪接。卷积核,步长,池化如下:

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值