tensorRT学习笔记

最新推荐文章于 2025-04-28 20:17:20 发布

心里的疯狮子

最新推荐文章于 2025-04-28 20:17:20 发布

阅读量1.5w

点赞数 5

本文链接：https://blog.youkuaiyun.com/qq_36124767/article/details/68484092

版权

本文详细介绍了使用TensorRT C++API进行深度学习模型优化和推理的过程，包括模型导入（Caffe、UFF、ONNX）、网络定义、引擎构建、序列化、推理及内存管理。重点讲解了如何初始化TensorRT、创建网络、构建优化引擎以及执行推断的步骤和注意事项。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

tensorRT学习笔记 C++version

1.1 初始化tensorRT的方式

有两种方式初始化TensorRT：
1、创建IBuilder对象去优化网络
2、创建IRuntime对象执行一个被优化的网络

这两种方式，你都需要先实现一个logging interface（日志接口），TensorRT会通过这个接口进行报错、警告和消息提示

class Logger : public ILogger
{
    void log(Severity severity, const char* msg) override
    {
        //不提示INFO信息，只显示警告和错误
        if (severity != Severity::kINFO)
        {
            std::cout << msg << std::endl;
        }
    }
}gLogger;

注意：你可能会创建很多的IBuilder和IRuntime，但是logger是一个单例！！！

1.2 在C++中创建一个网络定义

使用tensorRT的第一步就是从你的model中创建一个tensorRT的网络定义
可以从别的深度学习框架中进行导入，现在支持：
1、Caffe（both BVLC）
2、ONNX
3、UFF（used for tensorflow）
同样也可以使用TensorRT API直接构造模型，但是需要在网络层中使用少量API定义每一层，并且实现自己导入参数机制，来导入已经训练完毕的模型参数

在以上的方式你必须明确告诉tensorRT哪些张量是输出，因为被确定为输出的张量不会因为采取加速而被builder进行优化。

输入和输出张量都需要进行命名（使用ITensor::setName()）

同时推理的时候，需要为引擎提供输入和输出的buff缓存指针

还有对于tensorRT网络定义很重要的一个方面，就是包含指向模型权重的指针，它会被builder拷贝到优化引擎里

注意：如果网络定义是从语法中创建的，解析器占用权重的内存，因此解析器在builder运行前都不能被删除