Tensorrt 定义网络

原创已于 2024-03-20 10:41:27 修改 · 222 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#网络 #开发语言 #c++

于 2024-03-05 19:36:29 首次发布

本文展示了如何使用NVIDIA的InferBuilder和ONNXParser库，在C++中构建一个推理模型，从头开始定义网络结构，添加SoftMax层，并将模型转换为ONNX格式保存到文件。

#include "NvInfer.h"
#include "NvInferPlugin.h"
#include "NvOnnxConfig.h"
#include "NvOnnxParser.h"
#include <iostream>
#include <fstream>

using namespace nvinfer1;

int main()
{
    // 创建推理构建器
    IBuilder* builder = createInferBuilder(gLogger);
    INetworkDefinition* network = builder->createNetwork();

    // 定义输入张量
    ITensor* input = network->addInput("input", DataType::kFLOAT, Dims3(3, 224, 224));

    // 添加Softmax层
    ISoftMaxLayer* softmax = network->addSoftMax(*outputTensor);

    // 设置网络的输出
    softmax->getOutput(0)->setName("output");
    network->markOutput(*softmax->getOutput(0));

    // 创建推理引擎
    ICudaEngine* engine = builder->buildCudaEngine(*network);

    // 将引擎序列化为ONNX格式
    nvonnxparser::IOnnxConfig* onnxConfig = nvonnxparser::createONNXConfig();
    nvonnxparser::IONNXParser* onnxParser = nvonnxparser::createONNXParser(*network, gLogger);
    onnxParser->parse(onnxConfig);
    
    // 保存ONNX模型到文件
    std::ofstream onnxFile("test.onnx", std::ios::binary);
    onnxFile.write(onnxParser->getModelAsText(onnxConfig), strlen(onnxParser->getModelAsText(onnxConfig)));
    onnxFile.close();

    // 释放资源
    onnxParser->destroy();
    onnxConfig->destroy();
    engine->destroy();
    network->destroy();
    builder->destroy();

    return 0;
}