TensorRT INT8 量化YOLO模型—— trtexec

原创已于 2025-01-23 14:38:44 修改 · 2k 阅读

CC 4.0 BY-SA版权

文章标签：

于 2025-01-23 14:33:53 首次发布

64 篇文章

订阅专栏

TensorRT 提供了 trtexec 工具，可以方便地将模型转换为 TensorRT 引擎，并支持 INT8 量化。trtexec 是一个命令行工具，适用于快速测试和部署模型，尤其适合对 ONNX 或 UFF 格式的模型进行量化和优化。

以下是使用 trtexec 进行 INT8 量化的具体步骤：

安装 TensorRT：
- 确保已安装 TensorRT，并且 trtexec 工具可用。trtexec 通常位于 TensorRT 安装目录的 bin 文件夹中。
- 将 trtexec 添加到系统环境变量中，或者直接使用其完整路径。
准备校准数据集：
- 准备一个小型校准数据集（通常 100-1000 张图片），用于 INT8 量化校准。
- 校准数据集需要以 TensorRT 支持的格式存储（如 .npy 文件或图像文件）。
导出模型为 ONNX 格式：
- 如果模型是 PyTorch 或 TensorFlow 格式，需要先将其导出为 ONNX 格式。
- 以 YOLOv5 为例，导出 ONNX 模型的命令如下：
```
python export.py --weights yolov5s.pt --include onnx --img 640 --batch 1
```

trtexec --onnx=yolov5s.onnx --int8 --calib=<校准数据集路径> --saveEngine=yolov5s_int8.engine

假设校准数据集是一个包含图像的文件夹（如 calib_images/），可以使用以下命令进行量化：

trtexec --onnx=yolov5s.onnx --int8 --calib=calib_images/ --saveEngine=yolov5s_int8.engine

如果校准数据集是 .npy 文件（如 calib_data.npy），可以使用以下命令：

trtexec --onnx=yolov5s.onnx --int8 --calib=calib_data.npy --saveEngine=yolov5s_int8.engine

trtexec 支持两种校准数据集格式：

图像文件夹：
- 将校准图像存储在一个文件夹中（如 calib_images/）。
- 图像会被自动加载并预处理为模型输入格式。
.npy 文件：
- 将校准数据保存为 .npy 文件。
- 文件内容应为 NumPy 数组，形状为 (N, C, H, W)，其中：
  - N 是样本数量。
  - C 是通道数。
  - H 是高度。
  - W 是宽度。

量化完成后，可以使用 trtexec 验证量化后的模型性能：

trtexec --loadEngine=yolov5s_int8.engine

trtexec 是 TensorRT 提供的一个强大工具，可以快速完成模型的 INT8 量化和优化。通过简单的命令行操作，您可以将 YOLO 等模型转换为高效的 TensorRT 引擎，并部署到 NVIDIA GPU 上。

2 条评论