量化入门

在这里插入图片描述
变成128个负数,一个0,127个正数(用补码的规则)
在这里插入图片描述
非结构化的剪枝(比如只是把某些值置为0),在gpu上并不会有性能的提升
在这里插入图片描述
数值的选择性减少了,网络的表达能力可能会有比较大的下降
量化精度和范围之间的权衡
均匀or非均匀量化
反转的问题:
梯度不匹配
比如求出来的h已经不能用4bit表示
得到输出值后要重新用P来重新量化一遍
而P和Q都是阶梯函数,在大量位置的梯度都是0,所以对P,Q求梯度得到的都是0无法顺利优化
解决方法:
在这里插入图片描述
forward的时候在用阶梯函数做量化,而在backward的时候并不做量化,STE,都视为1,网络可以训练的动,还要做一个clip
带来的问题是训练不稳定由梯度不匹配导致:从上面红框中的公式可以发现,实际上是在认为量化前和量化后的参数(激活值ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值