本篇文章只对weight做了量化,且是三值量化。
量化目标:
量化方式:
对于Δ∗\Delta^{*}Δ∗的取值,文章给出了下面的解释
总之就是正态分布约为0.6σ\sigmaσ,标准分布为13a\frac {1}{3}a31a.
trainning 和inference的操作:
采用了train-aware quantization。
在inference的时候再把全精度的weights去掉,只保留量化后的部分。
本篇文章只对weight做了量化,且是三值量化。
量化目标:
量化方式:
对于Δ∗\Delta^{*}Δ∗的取值,文章给出了下面的解释
总之就是正态分布约为0.6σ\sigmaσ,标准分布为13a\frac {1}{3}a31a.
trainning 和inference的操作:
采用了train-aware quantization。
在inference的时候再把全精度的weights去掉,只保留量化后的部分。