yolo-TensorRT相关代码逐步详解-pt转engine

李卓璐

已于 2025-03-11 08:41:49 修改

阅读量415

点赞数 3

分类专栏：学习笔记文章标签： YOLO

于 2025-03-10 17:28:39 首次发布

本文链接：https://blog.youkuaiyun.com/LZL2020LZL/article/details/146158759

版权

基于TensorRT 的推论运行速度会比仅使用CPU 快40倍，提供精度INT8 和FP16 优化，支援TensorFlow、Caffe、Mxnet、Pytorch 等深度学习框架，其中Mxnet、Pytorch 需先转换为ONNX 格式。

TensorRT的构建流程大致分为几个步骤：创建构建器和网络、解析模型、配置构建参数、构建引擎、序列化与保存。

这里以yolov12-main\ultralytics\engine\exporter.py为例，逐步解读tensorrt相关代码。

一些版本的判断，没啥可讲得。

    def export_engine(self, dla=None, prefix=colorstr("TensorRT:")):
        """YOLO TensorRT export https://developer.nvidia.com/tensorrt."""
        assert self.im.device.type != "cpu", "export running on CPU but must be on GPU, i.e. use 'device=0'"
        f_onnx, _ = self.export_onnx()  # run before TRT import https://github.com/ultralytics/ultralytics/issues/7016

        try:
            import tensorrt as trt  # noqa
        except ImportError:
            if LINUX:
                check_requirements("tensorrt>7.0.0,!=10.1.0")
            import tensorrt as trt  # noqa
        check_version(trt.__version__, ">=7.0.0", hard=True)
        check_version(trt.__version__, "!=10.1.0", msg="https://github.com/ultralytics/ultralytics/pull/14239")

        # Setup and checks
        LOGGER.info(f"\n{prefix} starting export with TensorRT {trt.__version__}...")
        is_trt10 = int(trt.__version__.split(".")[0]) >= 10  # is TensorRT >= 10
        assert Path(f_onnx).exists(), f"failed to export ONNX file: {f_onnx}"
        f = self.file.with_suffix(".engine")  # TensorRT engine file
        logger = trt.Logger(trt.Logger.INFO)
        if self.args.verbose:
            logger.min_severity = trt.Logger.Severity.VERBOSE

1.Engine builder引擎构建配置，2.配置构建参数

 # 1.Engine builder引擎构建配置
        builder = trt.Builder(logger)
        config = builder.create_builder_config()

TensorRT 的优化方法：最大工作空间设定
较大的 workspace 允许 TensorRT 尝试更多的优化策略，例如：
更复杂的层融合（layer fu

最低0.47元/天解锁文章