论文总结：WRPN: Wide Reduced-Precision Networks

gcf_uinque

于 2020-02-19 18:16:57 发布

阅读量828

点赞数

CC 4.0 BY-SA版权

原文链接：https://blog.youkuaiyun.com/shanglianlm/article/details/100549198

本文探讨了WRPN技术，一种在不牺牲网络精度的情况下，实现激活层量化的高效方法。通过对权重和激活值的量化，WRPN有效减少了内存占用，尤其是在使用minibatch时。论文提出了一种更简单的量化公式，适用于有符号权重和无符号激活值，并通过增加特征图同时降低精度，实现了整体复杂性的减少，同时保持了网络的高精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文地址：https://arxiv.org/pdf/1709.01134v1.pdf

这篇论文主要篇幅都花在实验上，对于wrpn的具体原理等并未详细介绍。下面简单介绍笔者对该论文的理解。

主要内容

该论文最大贡献就是在不影响网络精度的前提下，对于激活层的量化。
如下图所示，使用minibatch时，随着batch数量的增加，激活层占用的内存显著增加。所以，作者提出了激活层量化的wrpn方法。
在这里插入图片描述
DoReFa的k位权重量化公式：

而WRPN则是在此基础上提出更简单的量化公式：

其中，权重是带符号的，故此留一位作为符号位(k-1)；而激活值则是无符号的。
需要注意的是，事先要将权重限制在[-1,1]，将激活值限制在[0,1]，具体方法不限(如Tensorflow中的tf.clip_by_val函数)。

wrpn是作者通过大量实验总结所得出的，按照笔者的理解，就是增加特征图的同时降低精度，使得整体的复杂性比原本网络小得多，而且由于特征图的增加，量化后整个网络的精度反而不会降低多少。

这种方法还需要更多的实验结果进行支撑，有兴趣的可以尝试。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。