动态卷积&&条件卷积

不想敲代码的小杨

已于 2022-10-24 19:17:27 修改

阅读量5.2k

点赞数 5

分类专栏：深度学习基础知识文章标签： 1024程序员节

于 2022-10-24 10:46:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_43921949/article/details/127484821

版权

最近了解到了动态卷积的这一概念，觉得使用动态卷积来替换常规卷积能够减少很多的计算量，所以便记录一下有关动态卷积三篇论文的学习笔记。

目录

一：CondConv: Conditionally Parameterized Convolutions for Efficient Inference

二：Dynamic Convolution: Attention over Convolution Kernels

三：Omni dimensional dynamic convolution

一：CondConv: Conditionally Parameterized Convolutions for Efficient Inference

卷积是当前CNN网络的基本构成单元之一，其有一个基本的假设就是卷积参数对所有样例共享。本文提出了一种动态卷积，它可以为每一个样例学习一个特定的卷积核参数。

以往的CNN的性能提升更多源自于模型尺寸和容量的提升以及更大的数据集。但是模型尺寸的进一步提升会加大计算开销。

作者提出了一种条件参数卷积来解决上述问题，通过计算卷积核参数打破了传统的静态卷积的特性。作者将CondConv中的卷积核参数化为多个专家知识的线性组合（其中 $\alpha _{1},... \alpha _{n}$ 是通过梯度下降学习的加权系数）: $(\alpha _{1}W_{1}+...+\alpha _{n}W_{n})*x$ 为更有效的提升模型容量，在网络设计中可以提升专家数量，同时专家知识只需要进行一次组合，这就可以在提升模型容量的同时保持高效。

方法

在传统的卷积中，卷积核参数经训练确定且对所有输入样本一视同仁，而在动态卷积CondConv中卷积核参数通过对输入的变换得到，这个过程可以用公式表述为：

其中 $\alpha _{i}=r_{i}(x)$ 是一个样本依赖加权参数。在动态卷积ConConv中，每个卷积核 $W_{i}$ 具有与标准卷积核参数相同的维度。

常规卷积容量提升依赖于卷积核尺寸与通道数的提升，这将进一步提升网络的整体计算，而CondConv则只需要在执行卷积计算之前通过多个专家对输入样本计算加权卷积核。关键的是，每个卷积核只需计算一次并作用于不同位置即可。这意味着：通过提升专家数据量达到提升网络容量的目的，而代码仅仅是很小的推理耗时：每个额外参数仅需一次乘加。

本文提出的方法如图（a）。图中的ROUTE FN指的是Routing Function可以理解为一个注意力机制相当于GAP+FC+Sigmod。在图（b）中，不同的W相当于不同的权重，不同的卷积核。每一条路径就是一个专家，然后通过Combine加权操作。但是这样计算量过大。但是作者证明了图（a）图（b）两种方法是等效的但是本文提出的图（a࿰

最低0.47元/天解锁文章

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。