文章目录
文章信息
- 模型: ModernTCN (A Modern Pure Convolution Structure for General Time
Series Analysis) - 关键词:现代卷积
- 作者:Luo donghao, wang xue
- 机构: 清华大学精密仪器系
- 发表情况:ICLR 2024(Published: 16 Jan 2024, Last Modified: 22 Mar 2024)
- 网址:ModernTCN: A Modern Pure Convolution Structure for General Time Series Analysis
前言
提升感受野
基于Transformer
的模型和基于MLP
的模型具有全局有效感受野(ERF),因此可以更好地捕获长期时间(跨时间)依赖性,从而显著优于传统的TCN
。而SCINet
和MICN
主要关注的是设计更复杂的结构来处理传统的卷积,而忽略了更新卷积本身的重要性,下图给出了这两种模型的感受野对比。
其中,ModernTCN通常采用大核,来有效地提高ERF。
相关知识
Depthwise卷积(DWConv)
Depthwise Convolution的一个卷积核负责一个通道,一个通道只被一个卷积核卷积。而常规卷积每个卷积核是同时操作输入图片的每个通道,这样就不会混合通道,只会混合token
Pointwise 卷积(PWConv)
与常规卷积运算非常相似,它的卷积核的尺寸为 1×1×M(M为上一层的通道数)。所以这里的卷积运算会将上一步的map在深度方向上进行加权组合,生成新的Feature map。有几个卷积核就有几个输出Feature map。
组卷积(Group Convolution)
组卷积是将输入数据的 C i n C_{in} Cin 个channel划分为 g g g 组,即每组的通道数为 C i n