3DCNN参数解析:2013-PAMI-3DCNN for Human Action Recognition

参数分析
Input:7 @ 60 ×\times× 40, 7帧,图片大小60 ×\times× 40
hardwired: H1
产生5通道信息,分别是gray, gradient-x, gradient-y, optflow-x, optflow-y。前三个对于每一张图片都计算得到一张图,后两个是相邻两张图片得到一张图。
因此,经过hardwired可以得到:7 ×\times× 3 + 6 ×\times× 2 = 33
经过hardwired可以得到33 @ 60 ×\times× 40
3DCNN layer:C2
对于前面的5个通道,每个通道都用2个kernel size: 7 ×\times× 7 ×\times× 3 (7 ×\times× 7是spatial dimension, 3是temporal dimension)的3D卷积(padding=0, stride=1)
((7-3+1) ×\times× 3 + (6-3+1) ×\times