TensorRT多平台编译实战：Linux/Windows全流程指南与macOS兼容方案-优快云博客

TensorRT多平台编译实战：Linux/Windows全流程指南与macOS兼容方案

【免费下载链接】TensorRT NVIDIA® TensorRT™ 是一个用于在 NVIDIA GPU 上进行高性能深度学习推理的软件开发工具包（SDK）。此代码库包含了 TensorRT 的开源组件项目地址: https://gitcode.com/GitHub_Trending/tens/TensorRT

引言：跨平台部署的痛点与解决方案

你是否曾因TensorRT编译环境配置不当导致项目延期？是否在Windows上成功编译的模型无法在Linux服务器运行？本文将系统讲解TensorRT在Linux、Windows的原生编译流程，以及macOS的兼容方案，帮你实现"一次编写，多平台部署"的工程目标。

读完本文你将获得：

3大操作系统的环境配置清单与校验方法
9个关键编译参数的调优技巧
5类常见编译错误的诊断流程图
Docker容器化编译的最佳实践
macOS平台的替代方案与性能对比

一、Linux平台编译指南（Ubuntu 20.04/22.04）

1.1 环境准备与依赖安装

# 基础依赖
sudo apt-get update && sudo apt-get install -y \
    build-essential libcurl4-openssl-dev wget git pkg-config \
    libssl-dev pbzip2 pv bzip2 unzip

# 安装CUDA 12.8（以Ubuntu 22.04为例）
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update && sudo apt-get install -y cuda-12-8 libcudnn8=8.9.6.50-1+cuda12.2

# 安装CMake 3.27.9
cd /tmp && wget https://github.com/Kitware/CMake/releases/download/v3.27.9/cmake-3.27.9-Linux-x86_64.sh
chmod +x cmake-3.27.9-Linux-x86_64.sh
sudo ./cmake-3.27.9-Linux-x86_64.sh --prefix=/usr/local --exclude-subdir --skip-license

1.2 源码编译流程

# 克隆仓库
git clone -b main https://gitcode.com/GitHub_Trending/tens/TensorRT TensorRT
cd TensorRT
git submodule update --init --recursive

# 配置编译选项
mkdir -p build && cd build
cmake .. \
    -DTRT_LIB_DIR=/usr/lib/x86_64-linux-gnu \
    -DTRT_OUT_DIR=$(pwd)/out \
    -DCUDA_VERSION=12.8 \
    -DCUDNN_VERSION=8.9 \
    -DBUILD_PLUGINS=ON \
    -DBUILD_PARSERS=ON \
    -DBUILD_SAMPLES=ON \
    -DGPU_ARCHS="80 86 89"  # 针对Ampere/ Ada Lovelace架构

# 多线程编译
make -j$(nproc)

1.3 Docker容器化编译方案

基础镜像	Dockerfile路径	编译命令
Ubuntu 20.04	docker/ubuntu-20.04.Dockerfile	`./docker/build.sh --file docker/ubuntu-20.04.Dockerfile --tag tensorrt-ubuntu20.04`
Ubuntu 22.04	docker/ubuntu-22.04.Dockerfile	`./docker/build.sh --file docker/ubuntu-22.04.Dockerfile --tag tensorrt-ubuntu22.04`
RockyLinux 8	docker/rockylinux8.Dockerfile	`./docker/build.sh --file docker/rockylinux8.Dockerfile --tag tensorrt-rockylinux8`

启动容器进行编译：

./docker/launch.sh --tag tensorrt-ubuntu22.04 --gpus all
# 在容器内执行
cd /workspace/TensorRT && mkdir -p build && cd build
cmake .. -DTRT_LIB_DIR=/usr/lib/x86_64-linux-gnu -DTRT_OUT_DIR=$(pwd)/out
make -j$(nproc)

二、Windows平台编译指南（Win10/11 x64）

2.1 环境配置清单

# 安装Visual Studio 2022（含C++桌面开发组件）
# 安装CUDA 12.8与cuDNN 8.9
# 设置环境变量
$env:TRT_LIBPATH="C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.8\lib\x64"
$env:CUDNN_PATH="C:\Program Files\NVIDIA GPU Computing Toolkit\cuDNN\v8.9"
$env:PATH+=";C:\Program Files\CMake\bin"

2.2 CMake配置与编译

cd TensorRT
mkdir -p build
cd build
cmake .. -G "Visual Studio 17 2022" -A x64 `
    -DTRT_LIB_DIR="$env:TRT_LIBPATH" `
    -DCUDNN_ROOT_DIR="$env:CUDNN_PATH" `
    -DTRT_OUT_DIR="$pwd\out" `
    -DCUDA_VERSION=12.8 `
    -DBUILD_PLUGINS=ON `
    -DBUILD_SAMPLES=ON

# 使用MSBuild编译
msbuild TensorRT.sln /property:Configuration=Release -m:$env:NUMBER_OF_PROCESSORS

2.3 编译参数详解

参数	说明	Windows特有配置
CMAKE_GENERATOR	指定构建系统生成器	"Visual Studio 17 2022" -A x64
TRT_LIB_DIR	TensorRT库路径	需指向CUDA安装目录下的lib/x64
CUDNN_ROOT_DIR	cuDNN根目录	需包含include和lib/x64子目录
GPU_ARCHS	目标GPU架构	例如"86"对应RTX 30系列

三、macOS平台兼容方案

3.1 官方支持状态

TensorRT官方未提供macOS原生支持，主要限制包括：

缺乏针对Apple Silicon的CUDA驱动
macOS不支持NVIDIA GPU虚拟化技术
核心编译脚本中无Darwin平台适配代码

3.2 替代方案对比

方案	实现方式	性能损耗	操作复杂度
Docker Desktop	运行Linux容器	~15%	低
虚拟机(VMware/Parallels)	安装Linux系统	~5-10%	中
云服务器	AWS EC2/GCP Compute Engine	无	高

3.3 Docker Desktop方案实现

# 安装Docker Desktop for Mac
# 启用Docker命令行
docker --version

# 拉取TensorRT镜像
docker pull nvcr.io/nvidia/tensorrt:23.04-py3

# 启动容器
docker run -it --rm --gpus all nvcr.io/nvidia/tensorrt:23.04-py3 /bin/bash

# 在容器内编译
git clone https://gitcode.com/GitHub_Trending/tens/TensorRT
cd TensorRT && mkdir -p build && cd build
cmake .. -DTRT_LIB_DIR=/usr/lib/x86_64-linux-gnu
make -j$(nproc)

四、跨平台编译常见问题诊断

4.1 编译错误流程图

mermaid

4.2 典型问题解决方案

问题1：CUDA版本不匹配

CMake Error at CMakeLists.txt:123 (find_package):
  Could not find a configuration file for package "CUDA" that is compatible
  with requested version "12.8".

解决：确认CUDA Toolkit安装路径，指定-DCUDA_TOOLKIT_ROOT_DIR=/usr/local/cuda-12.8

问题2：GPU架构不支持

nvcc fatal   : Unsupported gpu architecture 'compute_89'

解决：查询GPU算力值，修改-DGPU_ARCHS="86"（如RTX 3060算力为8.6）

五、编译优化与最佳实践

5.1 编译参数优化

参数	推荐值	作用
CMAKE_BUILD_TYPE	Release	启用优化，减小二进制体积
BUILD_SHARED_LIBS	ON	生成动态链接库，节省内存
BUILD_TESTS	OFF	跳过测试，加快编译速度
USE_PREBUILT_PARSERS	ON	使用预编译解析器
CMAKE_CUDA_FLAGS	-O3	启用CUDA代码优化

5.2 多版本共存方案

# 创建不同版本目录
mkdir -p ~/tensorrt/10.8.0 ~/tensorrt/9.2.0

# 分别编译安装
cd ~/tensorrt/10.8.0
cmake /path/to/source -DTRT_OUT_DIR=$(pwd)/out
make install

# 使用时指定库路径
export LD_LIBRARY_PATH=~/tensorrt/10.8.0/out:$LD_LIBRARY_PATH

六、总结与展望

TensorRT多平台编译的核心在于理解各操作系统的环境差异和编译工具链特性。Linux平台提供最完整的支持和最佳性能，Windows适合桌面开发场景，macOS用户则需通过容器化方案间接使用。随着NVIDIA软件生态的不断完善，未来可能会看到对更多平台的官方支持。

建议收藏本文作为TensorRT编译参考手册，关注项目GitHub仓库获取最新更新。如有编译问题，欢迎在评论区留言讨论。

下期预告：TensorRT模型优化全流程：从ONNX转换到INT8量化

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考