【论文阅读笔记】Training Quantized Nets：A Deeper Understanding

最新推荐文章于 2024-08-21 08:28:01 发布

原创最新推荐文章于 2024-08-21 08:28:01 发布 · 758 阅读

0 ·

CC 4.0 BY-SA版权

论文读书笔记同时被 2 个专栏收录

80 篇文章

订阅专栏

模型量化

18 篇文章

订阅专栏

本文对比分析了三种量化网络训练方法：确定性舍入、随机舍入和BinaryConnect结合ADAM优化器的效果。研究发现BC-ADAM在训练精度上表现最佳，SR-ADAM虽优于R-ADAM，但在性能上仍落后于BC-ADAM。实验还指出SR-ADAM和BC-ADAM在权重更新、batch_size选择上的显著差异。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

全文概括

本文目的在于了解各种训练量化网络的方法的行为差异，成功或失败的原因。

本文证明了BC (用二进制权值进行 forward backward 更新权重由 full-precision )长期训练的行为具有非凸优化所需的重要退火特性，而经典的舍入算法缺乏这种特性。

本文证明了，对于非凸优化问题，SR(Stochastic Rounding)不会随着 lr 的衰减而稳定，即不会随着 lr 的衰减而变成低损失迭代 (SR优化方式的变化范围较大，即振荡幅度大)。SR 不同于传统随机方法的地方在于：它无法利用贪婪的局部搜索方法来寻找最优解。

ADAM 比调整良好的 SGD 要好用。

BC-ADAM 效果是在三种优化 (R-ADAM、SR-ADAM)算法中最好的

简介

更新权重有两种方式

全精度权重副本，进行权重更新
保留全精度权重副本，用 low-precision 权重直接进行权重更新。

三种训练量化网络的方式

1. Deterministic Rounding（R）
量化权重的方式： $Qd(w)=sign(w)∗Δ∗⌊∣x∣Δ+12⌋Q_d(w)=sign(w) * \Delta * \lfloor \frac {|x|} \Delta + \frac12 \rfloor$
其中， $Δ\Delta$ 为 step-size ， $⌊∗⌋\lfloor * \rfloor$ 为舍入到最接近的量化数
更新权重的方式： $wbt+1=Qd(wbt−α▽∂f∂wb)w_b^{t+1}=Q_d(w_b^t-\alpha \triangledown \frac {\partial f} {\partial w_b})$ 即 forward、backward、parameters update 都在量化数上进行的
2. Stochastic Rounding（SR）
量化权重的方式： $p≤wΔ−⌊wΔ⌋⌊wΔ⌋otherwiseQ_s(w)=\begin{cases} \lfloor \frac w \Delta \rfloor + 1 & if\ \ p \leq \frac w \Delta - \lfloor \frac w \Delta \rfloor \\ \lfloor \frac w \Delta \rfloor & otherwise \end{cases}$
更新权重的方式： $wbt+1=Qs(wbt−α▽∂f∂wb)w_b^{t+1}=Q_s(w_b^t-\alpha \triangledown \frac {\partial f} {\partial w_b})$
3. BinaryConnect（BC）
更新权重的方式： $wrt+1=wrt−α▽∂f∂Q(wrt)w_r^{t+1}=w_r^t-\alpha \triangledown \frac {\partial f} {\partial Q(w_r^t)}$ 即先对权重进行量化，再进行 forward、backward，计算的梯度用于在 full-precision 上进行权重更新。