Explicit Loss-Error-Aware Quantization

该文提出了一种创新的量化方法,使用全精度网络的误差来更新权重,而不是依赖于量化网络的误差。这种方法避免了梯度不匹配问题,通过结合全精度网络的误差和量化误差作为正则项,寻找最佳的全精度网络表示,同时逐步量化权重。实验表明,这种策略在保持精度的同时,有效地进行了网络量化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文提出了使用全精度网络而非量化网络的误差更新权重的方法,以及对INQ的改进。

一般的量化网络,在训练时都会使用量化网络或混合网络(部分网络被量化)的误差来更新权重。本文则另辟蹊径,使用全精度网络的误差来更新权重。不仅取得了较好的结果,还避免了梯度的不匹配问题。

其损失函数为:
在这里插入图片描述
第一项是全精度网络的误差,第二项是全精度网络和量化网络的差异,第三项是量化权重和全精度权重的期望差。a1和a2是两个正的超参数。
在这里插入图片描述
作者定义Lp如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
这样式5的后两项形式就统一了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值