IOptimizationProfile 是 TensorRT 中管理动态输入形状优化配置的核心类,用于定义可变尺寸输入的最小、最优和最大范围,确保引擎在不同输入尺寸下的性能最优。以下从核心功能到实践应用全面解析:
一、核心功能
功能 | 说明 |
---|---|
动态形状定义 | 为动态维度(如Batch、宽高)设置 min/opt/max 范围 |
性能优化 | 基于 opt 尺寸生成最高效内核,同时确保 min 和 max 范围内的兼容性 |
内存预分配 | 根据 max 尺寸预留显存,避免运行时内存不足 |