神经网络量化入门--Add和Concat

AI小男孩

已于 2022-03-15 15:32:51 修改

阅读量2.3k

点赞数 1

分类专栏：深度学习文章标签：神经网络深度学习

于 2022-03-14 09:51:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/u012954083/article/details/123471693

版权

本文介绍了神经网络量化中的EltwiseAdd和Concat操作的量化处理，包括EltwiseAdd的rescale过程和Concat的无损量化策略。量化过程中涉及到的scale转换和offset操作可能引入精度损失，需要关注输入范围以减小误差。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

(本文首发于公众号)

好久没更新了，一方面是因为工作繁忙，另一方面主要是懒。

之前写过几篇关于神经网络量化的文章，主要是对 Google 量化论文以及白皮书的解读，但有一些细节的问题当时没有提及。这篇文章想补充其中一个问题：关于 ElementwiseAdd (简称 EltwiseAdd) 和 Concat 的量化。

EltwiseAdd量化

EltwiseAdd 的量化主要是在论文的附录里面提及的。过程不是太复杂，如果了解量化的基本原理的话，完全可以自己推导出来。

回忆一下量化的基本公式：
$\tag{1}$
(看不懂的可以再参考一下我之前的文章)

这里面 $r$ 是实数域中的数值 (一般是 float)， $q$ 则是量化后的整型数值 (常用的是 int8)。

EltwiseAdd 就是对两个 tensor 的数值逐个相加。假设两个 tensor 中的数值分别是 $r_1$ 、 $r_2$ ，相加得到的和用 $r_3$ 表示，那全精度下的 EltwiseAdd 可以表示为：
$r_3 = r_1 + r_2 \tag{2}$
用量化的公式代入进去后可以得到：
$S_3(q_3-Z_3)=S_1(q_1-Z_1)+S_2(q_2-Z_2) \tag{3}$

最低0.47元/天解锁文章

博客等级

码龄11年

17
原创

80
点赞

248
收藏

78
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

高通Data free quantization保姆级讲解
章鱼饭.r: 博主，你那个数据分布图好实用？可以参考一下咋画的嘛？
量化训练之可微量化参数—LSQ
Shu.Rain: 您好，感谢分享，讲的很透彻。我对于最后一段GAN相关训练有个问题想要请教一下，请问有哪些技巧或者方法能够增强gan的生成表达能力呢？有没有这块相关的文献或者方法可以参考一下？我自己目前在做头发超分的工作，模型生成的发丝始终不够细腻，怀疑是不是模型生成能力不足或者训练方式的问题。感谢！
神经网络量化入门--量化感知训练
AI小男孩: 把模型里面保存的浮点值，按照量化参数scale和zeropoint映射成int8保存下来就可以了。我的demo里面暂时是用float来存这些int8整型，所以模型大小没有变化。
神经网络量化入门--量化感知训练
Pinkpinkpinky: 看到您量化部署这一块所写的，想请教一下您，在对网络进行量化感知训练之后，得到的model size并没有减小，怎么得到8bit量化压缩后的模型呢
量化训练之可微量化参数—LSQ
AI小男孩: 跟普通的QAT算法是一样的，训练完后，量化参数(scale、zero point、min、max)就确定了，按照fp转int的公式转就可以了

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。