47、模型部署与导出：从PyTorch到生产环境

p5l2m9n4o6q

于 2025-08-31 16:29:09 发布

阅读量38

点赞数

CC 4.0 BY-SA版权

分类专栏： PyTorch实战：从零到肺癌检测文章标签：模型部署 PyTorch ONNX

本文链接：https://blog.youkuaiyun.com/p5l2m9n4o6q/article/details/151168512

PyTorch实战：从零到肺癌检测专栏收录该内容

51 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

模型部署与导出：从PyTorch到生产环境

1. 模型部署到生产环境

1.1 基础服务器代码

首先，我们有一段基础的服务器代码，用于加载模型并进行推理：

import sys
import torch
import numpy as np
from flask import Flask, request, jsonify

app = Flask(__name__)

model = ...  # 这里需要定义模型
model.load_state_dict(torch.load(sys.argv[1], map_location='cpu')['model_state'])
model.eval()

def run_inference(in_tensor):
    with torch.no_grad():
        # LunaModel takes a batch and outputs a tuple (scores, probs)
        out_tensor = model(in_tensor.unsqueeze(0))[1].squeeze(0)
        probs = out_tensor.tolist()
        out = {'prob_malignant': probs[1]}
    return out

@app.route("/predict", methods=["POST"])
def predict():
    meta = json.load(request.files['meta'])
    blob = request.files['b