IEEE | DSConv: Efficient Convolution Operator

最新推荐文章于 2025-09-28 21:14:16 发布

原创最新推荐文章于 2025-09-28 21:14:16 发布 · 1.5k 阅读

·

0

·

CC 4.0 BY-SA版权

本文为博主原创文章，未经博主允许不得转载。

文章标签：

#深度学习 #计算机视觉

论文标题 ：DSConv: Efficient Convolution Operator

论文链接 ：https://arxiv.org/abs/1901.01928v2

发表时间 ：2019年11月

创新点

实现更低的内存使用，并且加快了计算速度

概要

引入了一种称为 DSConv（分布移位卷积）的卷积层变体

它可以很容易地替换到标准神经网络架构中，并实现更低的内存使用和更高的计算速度

DSConv 将传统的卷积核分解为两个组件：

可变量化核 (VQK)
分布偏移

通过在 VQK 中仅存储整数值来实现更低的内存使用和更高的速度

同时通过应用基于内核和通道的分布偏移来保留与原始卷积相同的输出

在 ResNet50 和 ResNet34 以及 AlexNet 和 MobileNet 上测试 ImageNet 中的 DSConv

通过将浮点运算替换为定点运算

将卷积核中的内存使用量减少了 14 倍，并将运算速度提高了 10 倍

方法

DSConv 的总体目标是通过使用量化和分布偏移来模拟卷积层的行为

在这里插入图片描述
DSConv 的设置如上图所示

原始卷积张量的大小为 (cho, chi, k, k)，其中 cho 是下一层的通道数，chi 是当前层中的通道，k是内核的宽度和高度

DSConv 分为两个不同的组件：

在这里插入图片描述

可变量化内核 (VQK)

此张量将仅保存可变位长整数值，并且它具有与原始卷积张量相同的大小 (cho, chi, k, k)

参数值设置为从原始浮点模型量化，一旦设置就不能改变

这是 DSConv 的量化组件，它将允许执行更快且内存有效的乘法

Distribution Shifts

这个组件的目的是改变 VQK 的分布以试图模仿原始卷积核的分布

通过使用两个张量在两个域中移动来做到这一点

“移位”是指缩放和偏置操作

第一个张量是 $Ker n e l D i s t r ib u t i o n S hi f t er (KD S)$ ，它移动 VQK 的每个 $(1, B L K, 1, 1)$ 切片中的分布，其中 BLK 是块大小的超参数

这个想法是内核移位器的每个值都用于移位 VQK 的 BLK 深度值的值

那么这个张量的大小是 $2 * (c h o, CE I L (c hi / B L K), k, k)$

其中 CEIL(x) 是向上舍入运算符，它保存单精度值

第二个张量是 $C hann e l D i s t r ib u t i o n S hi f t er (C D S)$ ，它移动每个通道中的分布

换句话说，它改变了每个 $(1, c hi, k, k)$ 切片中的分布

自然，这是一个大小为 $2 * (c h o)$ 的单精度数张量

实验
在这里插入图片描述

总结

原论文中还有，量化程序、分配转变和优化推理等步骤，但是如果个人使用，可直接使用 DSConv 来替代传统卷积

DSConv 较于传统 Conv 的优势在于计算速度快，占用内存更少

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小鹏AI 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。