PyTorch动态量化：官方教程学习笔记

最新推荐文章于 2025-12-02 17:06:56 发布

AvGroovy

最新推荐文章于 2025-12-02 17:06:56 发布

阅读量254

点赞数

CC 4.0 BY-SA版权

文章标签： pytorch 学习笔记

本文链接：https://blog.youkuaiyun.com/AvGroovy/article/details/133027497

PyTorch 专栏收录该内容

83 篇文章 ¥59.90 ¥99.00

订阅专栏

本文是PyTorch动态量化学习笔记，介绍了如何利用动态量化减小模型存储和计算开销，核心是将浮点模型转换为定点模型。通过一个MNIST手写数字识别的示例，详细展示了量化配置、模型转换、训练和评估过程。

PyTorch是一个广泛应用于深度学习的开源框架，它提供了丰富的工具和功能来支持模型的训练和部署。动态量化是PyTorch中的一个重要功能，它可以帮助我们在不损失太多模型精度的情况下，大幅度减小模型的存储和计算开销。在本篇文章中，我们将学习如何使用PyTorch的动态量化功能。

动态量化的核心思想是将浮点数模型转换为定点数模型，从而减小模型的存储和计算开销。在动态量化中，模型的权重和激活值被量化为低位数的整数，从而减小了它们在内存中的占用空间。同时，动态量化还使用缩放因子来保留一定的模型精度，并提供了量化和反量化操作来保证模型的准确性。

下面我们将通过一个示例来演示如何在PyTorch中使用动态量化。首先，我们需要导入必要的库和模块：

import torch
import torchvision

接下来，我们可以定义一个简单的卷积神经网络模型，用于对MNIST手写数字数据集进行分类：

class Net(torch.nn.

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AvGroovy

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

『大模型笔记』《Pytorch实用教程》（第二版）

AI新视界

07-07

919

时隔5年，历时4年，耗时2年的《Pytorch实用教程》第二版完成了。在第一版的精华之上，增加了丰富详实的深度学习应用案例和推理部署框架，使本书更系统性的涵盖深度学习工程师所涉及的知识面。如人工智能技术发展一浪接一浪，《Pytorch实用教程》第二版不是结束，而是开始，开启新的技术、新的领域、新的篇章，希望未来能继续与大家一起在人工智能技术里学习、进步。

05-14 周二 PyTorch动态量化和静态量化理解

不当初

05-14

4232

Pytorch动态量化量化网络意味着将其转换为使用降低精度的整数表示来表示权重和/或激活。从浮点数转换为整数时，基本上是将浮点数乘以某个比例系数，然后将结果四舍五入为整数。确定scale factor是各种量化方法的差异点。动态量化的关键思想是，对于激活来说，我们将会根据运行时观察到的数据范围来确定scale factor。这样可以确保 "调整 "比例因子，从而尽可能多地保留每个观测数据集的信号，而模型参数在模型转化过程中是已知的，他们提前转化并存储成INT8形式。

参与评论您还未登录，请先登录后发表或查看评论

详解pytorch动态量化

zoetu

07-13

3816

想要读取动态量化后模型的int8分布，但是发现模型内部已经是float，很诧异。。现在发现是量化后经过了一个反量化，那么op输出又成了floatTensor。

torch量化接口深度解读-eager模式-fx模式

weixin_40777649的博客

08-07

2205

接口总结量化模式解读。

pytorch模型量化

大鱼的博客

10-14

4249

模型量化是为了减少模型的大小，以便在边缘设备上进行计算首先建网络: import torch import torch.nn as nn from torchsummary import summary device = torch.device("cpu") class SimpleNet(nn.Module): def __init__(self, num_classes=10): super(SimpleNet, self).__init__() sel

Pytorch【60天修炼计划】之第二阶段——进阶：量化

karry_zzj的博客

11-15

6944

以下内容主要来自于Pytorch官网Pytorch量化，特此记录学习过程。（其实更像直接翻译了一下，逃～ Quantization 量化 1、什么是量化？量化是一种近来深度学习加速中快速发展的技术，它指的是以比浮点精度更低的比特宽度来执行计算并存储 Tensors 的技术。一个量化的模型便采用的是整数来对 Tensors 执行部分或全部操作。 2、量化的意义？因为量化精度低，则它使得在许...

Dynamic Quantization PyTorch官方教程学习笔记

诸神缄默不语的博客

03-24

6644

本文是PyTorch的教程Dynamic Quantization — PyTorch Tutorials 1.11.0+cu102 documentation的学习笔记。本文介绍如何用Dynamic Quantization加速一个LSTM模型的推理过程。Dynamic Quantization减少了模型权重的尺寸，加速了模型处理过程。

树莓派4B_Pytorch学习笔记20:初步认识深度学习框架

NULL指向我的博客

07-08

1306

123

PyTorch模型量化工具：提升低资源环境下的模型效率

在当前机器学习和深度学习领域，PyTorch已经成为了一个非常流行和先进的框架。它的易用性和灵活性使其在研究和实践中得到了广泛的认可。然而，对于那些资源受限的环境，例如只能使用CPU或者内存有限的系统，运行复杂...

pytorch深度学习入门（15）之-使用onnx模型量化

ajunbin859的专栏

11-17

1475

让我们使用 U8U8 作为 (activations ：uint8，权重：uint8），U8S8（激活：uint8，权重：int8），类似地S8U8和S8S8用于其余两种格式。该问题的解决方案是将原始计算图的权重和激活张量与量化图的权重和激活张量进行比较，确定它们最大的不同之处，并避免量化这些张量，或者选择另一种量化/校准方法。动态量化和静态量化之间的主要区别在于如何计算激活的尺度和零点。然而，量化过程中的模型优化给调试过程带来了困难，因为它可能会显着改变计算图，导致量化模型与原始模型截然不同。

Pytorch 1.3.0 量化介绍

zym19941119的博客

10-12

1万+

量化介绍量化指的是使用比浮点精度更少的比特数来进行yi计算和存储的技术。一个量化后的模型使用整数tensor而不是浮点数tensor来执行一部分或全部的操作。这是一种更紧凑的模型表现方式，并且可以利用许多硬件平台上的高性能向量操作。PyTorch支持INT8的量化，相比于FP32，模型大小减少了4x，对内存带宽的需求也减少了4x。INT8操作的硬件支持使得其计算通常要比FP32快2-4倍。量化主...

pytorch的官网提供的三种量化方式详解

最新发布

宝安小雨

12-02

108

深度学习实战（基于pytroch）系列（四十二）双向循环神经网络pytorch实现

echo的博客

11-29

765

本文介绍了双向循环神经网络(BiRNN)的PyTorch实现。BiRNN通过同时处理正向和反向序列信息，能够更好地捕捉上下文特征。文章详细阐述了BiRNN的数学定义和架构，包括正向/反向隐藏状态的计算方法以及输出层的拼接处理。提供了两种PyTorch实现方案：自定义实现和使用内置RNN模块的简化实现，并通过测试代码验证了模型输出的正确性。BiRNN特别适合需要全局上下文理解的任务，如机器翻译和语音识别等，能有效提升序列数据的建模能力。

用PyTorch训练一个猫狗分类器

shayudiandian的博客

11-24

591

model.fc = nn.Linear(model.fc.in_features, 2) # 替换全连接层。

【debug】解决 5070ti 与 pytorch 版本不兼容的问题

2301_79601111的博客

11-29

723

下载torch, torchvision（ torchvision要比torch日期晚一天）到本地，然后：pip install 本地的下载路径。print(torch.cuda.get_device_name(0)) # 获取第一个 GPU 的名字。print(torch.cuda.get_arch_list()) # 应包含'sm_120'nvidia-smi查到的可容纳的最大cuda的版本>=cuda版本>=pytorch版本。我查到的是12.8，那么我的cuda也下载12.8。

开源 vs 商业：主流AI生态概览——从PyTorch到OpenAI的技术格局之争

已掌握java全栈，简单的java项目逻辑。目前正在学习鸿蒙开发，有兴趣的小伙伴可以一起学习！！！

11-29

790

在人工智能迅猛发展的今天，开发者和企业面临一个关键选择：是拥抱开放协作的开源生态，还是依赖高效便捷的商业平台？TensorFlow、PyTorch、Hugging Face、OpenAI……这些名字不仅代表技术框架，更象征着两种截然不同的AI发展哲学。本文将深入对比主流AI平台，解析它们在技术、社区、商业模式与未来方向上的异同，助你做出更明智的技术选型。

人工智能领域博客

12-02

337

Dataset是Pytorch加载训练数据的基类，自定义类比如OSSDataset需要继承Dataset基类并自定义实现__getitem__、__len__以及__init__方法完成训练数据处理，LLM的Tokenizer在Dataset中完成__getitem__