【PTQ】Cross-Layer Equalization跨层均衡-证明和实践详细解读

最新推荐文章于 2025-08-31 11:49:43 发布

原创

最新推荐文章于 2025-08-31 11:49:43 发布 · 1.5k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #机器学习 #深度学习

本文对Cross-Layer Equalization跨层均衡进行解读，介绍符合规则的模型结构，阐述优化目标，通过公式推导解优化目标，还指出其存在只适合对称量化权重的PTQ方式、可能导致后量化效果差等限制和缺陷，最后展示实操结果，表明cle前后模型输出基本一致，权重更均衡。

Cross-Layer Equalization跨层均衡

aimet解读

符合规则的模型结构

统一要求：单数据流，中间激活不流向其他地方
概念说明：
- Conv: gruoups=1的普通卷积，包括TransposedConv和Conv
- DepthwiseConv: 深度可分离卷积，groups=in_channels, in_channels=out_channels。
cle均衡块：(相邻块的连接中间可能穿插Relu或者是Relu6等正缩放线性运算的算子)
- Conv ==> Conv
- Conv ==> DepthwiseConv ==> Conv
- DepthwiseConv ==> Conv

优化目标

前提说明：
- 正缩放线性运算函数特性： $\begin{align} f(sx)=sf(x) \end{align}$ ，relu/relu6等算子符合该特性
- 我们优化的函数总是以cle均衡块：Conv ==> Conv作为基础的情况，使用函数可表达为如下的函数
  $\begin{align} h=&f(W^{(1)}x+b^{(1)}) \\ y=&f(W^{(2)}h+b^{(2)}) \\ y=&f(W^{(2)}f(W^{(1)}x+b^{(1)})+b^{(2)}) \end{align}$
- 提出的优化目标和思路：
  - 出发点：cle的目的就是想要在模型推理结果不变的情况下，通过调整相连conv层的weight的每通道的权重，使得同一个weight的数值范围能够基本保持一致，这样能够让后续的per-layer量化效果能够和per-channel量化效果相当。
  - 思路：使用对角矩阵调整conv的每channel权重，使得该conv的每channel权重的数值范围range能够大致相同。而如何保证调整conv层权重后的模型推理运算结果不变，利用了正缩放线性运算函数特性。
- 具体的权重调整公式如下所示：
  $\begin{align} S=&diag(s_{i}) \\ h=&Sf(S^{-1}W^{(1)}x+S^{-1}b^{(1)}) \\ y=&f(W^{(2)}Sf(S^{-1}W^{(1)}x+S^{-1}b^{(1)})+b^{(2)}) \\ =&f(\tilde{W}^{(2)}f(\tilde{W}^{(1)}x+\tilde{b}^{(1)})+b^{(2)}) \end{align}$
- 上述的推演公式可知如下的调整后的新的权重：
  - (9)公式：对应pre-layer（也就是第一个conv）的权重的调整，即对每output_channel上进行了对应的调整
  - (10)公式：对应cur-layer（也就是第二个conv）的权重的调整，即对每input_channel上进行了对应的调整
    $\begin{align} \tilde{W}^{(1)}=&S^{-1}W^{(1)} \\ \tilde{W}^{(2)}=&W^{(2)}S \\ \tilde{b}^{(1)}=&S^{-1}b^{(1)} \end{align}$
- 具体的优化目标：
  - 理想情况下，对于同一个权重而言，希望每channel权重的range同整个权重的range相等。
  - 因此提出如下的优化目标：
    - $\tilde{r}^{(1)}_{i}$ :表示每channel通道权重的数值范围（都是按照对称量化进行衡量的）
    - $\tilde{R}^{(1)}$ :表示每整个权重的数值范围
    - (13)公式：最终的优化目标，获得一个 $S$ 能够数值最大
    $\begin{align} \tilde{p}^{(1)}_{i}=\frac{\tilde{r}^{(1)}_{i}}{\tilde{R}^{(1)}} \\ \mathop{\max}\limits_{S} \sum\limits_{i} \tilde{p}^{(1)}_{i} \tilde{p}^{(2)}_{i} \end{align}$

最低0.47元/天解锁文章