onnx 模型转换与 onnxruntime 和caffe2 推理速度比较

最新推荐文章于 2025-04-08 13:50:54 发布

gangeqian2

最新推荐文章于 2025-04-08 13:50:54 发布

阅读量2k

点赞数 1

分类专栏： pytorch 文章标签： pytorch onnx

本文链接：https://blog.youkuaiyun.com/gangeqian2/article/details/113184900

版权

onnx 模型转换与 onnxruntime 和caffe2 推理速度比较

背景

pytorch 模型通常包括网络结构.py文件和模型参数文件.pth，通常需要转换为onnx格式再向其他终端或移动端部署（onnx模型一般用于中间部署阶段，相当于翻译的作用）。移动端通常使用ncnn、mnn、Caffe2进行inference，实现实时计算。
本文展示pytorch转onnx的模型在PC端以CPU方式运行。

1、模型转换

1.1. pytorch 模型转onnx 模型

def torch2onnx(model, save_path):
    """
    :param model:
    :param save_path:  XXX/XXX.onnx
    :return:
    """
    model.eval()
    data = torch.rand(1, 3, 48, 64)
    input_names = ["input"]  
    output_names = ["cls","lmk"]  
    torch.onnx._export(model, data, save_path, export_params=True, opset_version=11, input_names=input_names, output_names=output_names)
    print("torch2onnx finish.")