KernelWarehouse：面向参数高效动态卷积

AI智韵

已于 2023-08-20 06:25:38 修改

阅读量1.4k

点赞数 1

分类专栏：高质量AI论文翻译文章标签：深度学习 pytorch YOLO 目标检测计算机视觉

于 2023-08-19 06:32:47 首次发布

不能复制，转发

本文链接：https://blog.youkuaiyun.com/m0_47867638/article/details/132374792

版权

高质量AI论文翻译专栏收录该内容

184 篇文章 ¥99.90 ¥299.90

订阅专栏

KernelWarehouse是一种新型动态卷积方法，旨在解决现有动态卷积方法参数效率低下的问题。通过核分割和仓库共享，KernelWarehouse能够在保持参数效率的同时增强模型的表示能力。实验表明，KernelWarehouse在ImageNet和MS-COCO数据集上的图像分类和目标检测任务中，与现有方法相比，取得了更好的性能，甚至在减少模型大小的情况下也能提升精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

摘要
1、简介
2、相关工作
3、方法
- 3.1、KernelWarehouse的表述
- 3.2、KernelWarehouse的注意力模块
4、实验
5、结论

摘要

动态卷积通过学习n个静态卷积核的样本依赖注意力加权的线性混合，相比普通卷积显示出优越的性能。然而，现有的设计在参数效率方面存在不足：它们将卷积参数的数量增加了n倍。这和优化困难导致我们在动态卷积方面没有研究进展，使我们无法使用显著的大值n（例如，n>100而不是典型的设置n<10）来推动性能边界。针对上述问题，本文提出了一种更通用的动态卷积形式——KernelWarehouse，可以在保证参数效率的同时提高表示能力。其核心思想是从减少卷积核维度和显著增加卷积核数量的角度，重新定义动态卷积中的“卷积核”和“组合卷积核”这两个基本概念。KernelWarehouse通过巧妙的卷积核划分和仓库共享，增强了相同层和连续层之间的卷积参数依赖性。具体来说，KernelWarehouse首先将ConvNet中任意卷积层的静态卷积核逐个划分为m个具有相同维度的互不重叠的核单元（kernel cells），然后基于一个由n个核单元（例如n=108）组成的预定义的“仓库”（warehouse）计算每个核单元作为线性混合，这个仓库也被共享到多个相邻的卷积层中，最后将静态卷积核替换为其对应的m个混合结果的顺序组合，从