onnx动态模型转静态模型

本文介绍如何将基于ONNX的动态深度学习模型转换为静态模型,以优化推理性能。通过Python接口,我们可以方便地进行模型转换,提升模型在实际应用中的效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


import onnx
import onnxruntime as rt
import os
import numpy as np
import argparse

class fix_dim_tools:
    def __init__(self, model_path, inputs_shape, inputs_dtype):
        assert os.path.exists(model_path), "{} not exists".format(model_path)
        if inputs_dtype is None:
            print('inputs_dtype is not define, use float for all inputs node')
            inputs_dtype = ['float']*len(inputs_shape)
        else:
            assert len(inputs_shape)==len(inputs_dtype), "inputs shape list should have same length as inputs_dtype"
    
        model = onnx.load(model_path)
        self.model = model
        self.model_path = model_path
        self.inputs_shape = inputs_shape
        self.inputs_dtype = inputs_dtype

        self.inputs_shape_dict = {
   }
        self.inputs_type_dict = {
   }
        self.outputs_shape_dict = {
   }
    
    def check_dynamic_input(self):
        # check dynamic input and get real input shape
        inputs_number = len(self.model.graph.input)
        assert inputs_number==len(self.inputs_shape),"model has {} inputs, but {} inputs_shape was given, not match".format(inputs_number,len(self.inputs_shape)
### ONNX 静态模型动态模型的区别 #### 定义与概念 静态量化是指在训练完成后,通过对整个数据集或其子集进行推理来收集统计信息,并基于这些统计数据确定量化的参数[^1]。而动态量化则是在运行时根据输入的数据实时调整量化参数,不需要预先准备校准数据集。 #### 实现方式 对于静态量化,在应用量化之前先执行一次完整的前向传播过程以获取激活值范围的信息;而对于动态量化,则只需调用 `ONNXRuntime` 提供的特定接口如 `quantize_dynamic()` 来完成换工作,无需额外处理步骤。 #### 性能影响 通常情况下,由于静态量化可以利用更精确地计算得到的最佳量化比例因子,因此可能会带来更好的精度保留效果以及潜在更高的性能优化空间。相比之下,尽管动态量化简化了部署流程并减少了前期准备工作,但在某些场景下可能无法达到相同水平的表现。 #### 可视化比较 为了直观地区分这两种类型的模型结构差异,可以通过 Netron 工具加载相应的 `.onnx` 文件来进行查看。例如: ```python import netron netron.start("./Static_QuantizedModel.onnx") # 加载静态量化后的模型 netron.start("./Dynamic_QuantizedModel.onnx") # 加载动态量化后的模型 ``` 上述代码片段展示了如何分别启动两个不同版本(静态动态)已量化的 ONNX 模型文件以便于观察它们内部节点的变化情况[^2]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

S1om

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值