IBuilder 是 TensorRT 模型优化的核心控制器,负责将原始模型转换为高度优化的推理引擎。以下从功能到实践的全面解析:
一、核心职责
功能 | 说明 |
---|---|
网络定义构建 | 创建 INetworkDefinition 对象,描述模型计算图结构 |
优化配置管理 | 通过 IBuilderConfig 设置精度模式、工作空间、动态形状等参数 |
模型优化与引擎生成 | 执行层融合、量化校准等优化,生成最终 ICudaEngine |
资源管理 | 控制优化过程中的显存和计算资源分配 |
二、核心方法详解
1. 创建网络定义
// 创建空网络(显式Batch模式)
INetworkDefinition* network = builder->create