【TensorRT】 ICudaEngine 类深度解析

浩瀚之水_csdn

已于 2025-04-23 13:59:36 修改

阅读量297

点赞数 4

分类专栏：深度学习目标检测(YOLO)专栏 # Tensorrt框架文章标签： tensorrt

于 2025-03-12 18:44:59 首次发布

本文链接：https://blog.youkuaiyun.com/a8039974/article/details/146211968

版权

深度学习目标检测(YOLO)专栏同时被 2 个专栏收录

324 篇文章 ¥9.90 ¥99.00

订阅专栏

Tensorrt框架

25 篇文章

订阅专栏

ICudaEngine 是 TensorRT 推理流程的核心载体，封装了优化后的计算图、内核函数及内存分配策略。以下从功能到实践全面解析其关键点：

一、核心职责

功能	说明
模型执行载体	包含优化后的计算图、层实现及内存规划
资源管理	管理模型运行所需的GPU内存、CUDA流等资源
元数据访问	提供输入/输出张量信息（名称、维度、数据类型）
上下文创建	生成多个执行上下文（IExecutionContext）支持并行推理

二、关键方法详解

1. 基础信息获取

// 获取引擎输入/输出数量
int numInputs = engine->getNbBindings() / 2;  // 假设每个绑定有输入和输出

// 获取张量名称及维度
const char* name = engine->getBindingName(bindingIndex);
nvinfer1::Dims dims

了解本专栏