KernelWarehouse:面向参数高效动态卷积

KernelWarehouse是一种新型动态卷积方法,旨在解决现有动态卷积方法参数效率低下的问题。通过核分割和仓库共享,KernelWarehouse能够在保持参数效率的同时增强模型的表示能力。实验表明,KernelWarehouse在ImageNet和MS-COCO数据集上的图像分类和目标检测任务中,与现有方法相比,取得了更好的性能,甚至在减少模型大小的情况下也能提升精度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

摘要

动态卷积通过学习n个静态卷积核的样本依赖注意力加权的线性混合,相比普通卷积显示出优越的性能。然而,现有的设计在参数效率方面存在不足:它们将卷积参数的数量增加了n倍。这和优化困难导致我们在动态卷积方面没有研究进展,使我们无法使用显著的大值n(例如,n>100而不是典型的设置n<10)来推动性能边界。针对上述问题,本文提出了一种更通用的动态卷积形式——KernelWarehouse,可以在保证参数效率的同时提高表示能力。其核心思想是从减少卷积核维度和显著增加卷积核数量的角度,重新定义动态卷积中的“卷积核”和“组合卷积核”这两个基本概念。KernelWarehouse通过巧妙的卷积核划分和仓库共享,增强了相同层和连续层之间的卷积参数依赖性。具体来说,KernelWarehouse首先将ConvNet中任意卷积层的静态卷积核逐个划分为m个具有相同维度的互不重叠的核单元(kernel cells),然后基于一个由n个核单元(例如n=108)组成的预定义的“仓库”(warehouse)计算每个核单元作为线性混合,这个仓库也被共享到多个相邻的卷积层中,最后将静态卷积核替换为其对应的m个混合结果的顺序组合,从

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI智韵

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值