LQ-Nets: Learned Quantization for Highly Accurate and Compact Deep Neural Networks 论文阅读

最新推荐文章于 2025-01-18 09:38:20 发布

weixin_30520015

最新推荐文章于 2025-01-18 09:38:20 发布

阅读量488

点赞数

CC 4.0 BY-SA版权

文章标签：人工智能

原文链接：http://www.cnblogs.com/dushuxiang/p/10602102.html

本文介绍了LQ-Nets，这是一种通过学习量化器实现高精度和紧凑的深度神经网络的方法。LQ-Nets允许联合训练量化网络和量化器，以适应不同的网络结构，如AlexNet、VGG-Net等，并在准确率上优于传统量化方法。这种方法通过学习权重和激活的任意比特宽度量化，实现了与位操作兼容，有助于提高推理速度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

摘要

　　虽然权重和激活量化是深度神经网络（DNN）压缩的有效方法，并且具有很多利用bit操作来提高推理速度的潜力，但在量化模型和完整模型之间的预测精度方面仍存在明显差距。为了解决这个差距，我们建议联合训练量化的，位操作兼容的DNN及其相关的量化器，而不是使用固定的手工量化方案，例如均匀或对数量化。我们学习量化器的方法适用于任意位精度的网络权重和激活，我们的量化器很容易训练。对CIFAR-10和ImageNet数据集的全面实验表明，我们的方法可以很好地适用于各种网络结构，如AlexNet，VGG-Net，GoogLeNet，ResNet和DenseNet，在准确度方面超过以前的量化方法。代码可从https://github.com/Microsoft/LQ-Nets获得

简介

　　我们建议联合训练量化的DNN及其相关的量化器。所提出的方法不仅使量化器可学习，而且使它们与按位运算兼容，从而保持适当量化的神经网络的快速推理优点。我们的量化器可以通过标准网络训练管道中的反向传播进行优化，并且我们进一步提出了一种基于量化误差最小化的算法，其产生更好的性能。所提出的量化可以应用于网络权重和激活，并且可以实现任意比特宽度。此外，可以应用具有非共享参数的分层量化器以获得进一步的灵活性。我们将通过我们的方法量化的网络称为“LQ-N