最近由于业务需求,接触到了Jetson边缘AI计算主板,博主使用的是Jetson Orin NX 16GB这个版本,可以看到其算力达到了100TOPS,这是一个非常恐怖的算力了,接下来便是博主对其的环境配置过程,博主要在该主板上运行一个旋转检测模型,过程如下:
Jetson
使用的是Arm
架构,所以在配置时会存在差异
在使用Jetson
系列设备时,为了实时查看CPU
,GPU
,我们首先应该安装Jtop
软件
1. 安装Jtop
监测软件
1.1 安装 pip3
因为我们需要使用pip3
来安装jtop
,所以需要在系统中先安装pip3
。
1.2 安装 jtop
随后直接输入jtop
即可:
随后我们点击INFO
,查看系统信息:
可用看到,此时CUDA
、cuDNN
都是没有的,OpenCV
也是不支持CUDA
加速的。
那么,我们接下来该怎么做呢,难道要像Window
、Ubuntu
下那样安装CUDA
和cudNN
吗,不不不,Jetson
为方便开发者,提供了 Jetpack
开发套件,其帮了我们大忙
2. 安装JETPACK套件
为啥安装 Jetpack
,那就是 Jetpack
是 Nvidia
为 Jetson
系列开发板开发的一款软件开发包,常用的开发工具基本都包括了,并在在安装 Jetpack
的时候,会自动安装匹配版本的CUDA
、cuDNN
、TensorRT
等。
我们耐心等待即可,安装完成后,再次调用 JTop
查看,此时我们看到CUDA
和cuDNN
已经装好了,接下来便是对其进行配置,并重新编译OpenCV
,使其能够支持CUDA
加速
目前,我们只是安装了CUDA和cuDNN,接下来我们需要对其进行配置
3. CUDA与cuDNN配置
cuDNN
默认安装路径在 /usr/lib/aarch64-linux-gnu
下CUDA
默认安装路径在 /usr/local/cuda
下
3.1 CUDA配置
配置Cuda环境变量:CUDA
已经默认安装在了/usr/local/cuda
下,运行如下指令:
我们使用nvcc-V
查看一下CUDA
配置:
3.2 cuDNN配置
虽然安装了cuDNN,但没有将对应的头文件、库文件放到cuda目录。
cuDNN
的头文件在:/usr/include
,库文件位于:/usr/lib/aarch64-linux-gnu
。将头文件与库文件复制到cuda
目录下:
随后创建软链接,这个步骤不能少,否则在OpenCV
编译时会报错,因为其找不到cuDNN
。
3.3 测试cuDNN
执行下面的命令:
默认会复制到这个路径下:
如果测试通过的话,会最终输出:
如果在执行sudo make clean && sudo make
时报错:
那么就表示缺少对应的库,安装下面的库即可:
安装完成之后再进行sudo make
,基本上就可以编译成功了。
4. OpenCV with CUDA编译
先前我们安装的OpenCV
无法通过CUDA
编译,因此我们要考虑是否是OpenCV
版本不匹配导致的,先前我们按照的是OpenCV 4.9
,而我们的CUDA
和cuDNN
版本分别是12.6
和9.3
,我们需要查看一下与之匹配的OpenCV
版本:
理论上博主使用OpenCV 4.9
应该是没有问题的,奈何就是不行,果断使用最新版本的OpenCV
,即4.13
,直接上就完了。
4.1 运行 CMake 配置
下载对应的 opencv
源码和 opencv_contrib
源码,然后创建,这里博主把 opencv_contrib
放到了opencv
下面,然后创建build
文件目录,开始CMake
配置。
注意,一定要下载opencv_contrib的源码,否则会报错,下面博主在执行时便遇到了这个问题。
因为OpenCV
的一些 CUDA
功能(如内存管理、底层工具)被移到了 opencv_contrib
仓库中的 cudev
模块中,所以我们需要下载opencv_contrib
将下载后的opencv_contrib
放到opencv
文件夹下:
随后切换到build
文件夹下,执行下面的脚本:
完成后的效果如下:
4.2 OpenCV with CUDA 编译与安装
生成CMake文件后,进行编译并安装
这个过程会比较漫长,预计得半个多小时 。。。。。
最终编译完成后效果:
在完成后,我们执行安装命令:
安装成功:
安装完成后,我们就可以进行测试了,我们依旧选择一个分类模型进行测试:cd
到/opencv/samples/cpp/example_cmake
目录下,然后打开opencv_example.cpp
文件,替换为下面的代码,这个代码执行的便是 加载分类ONNX
模型进行推理。
随后执行下面的命令:
最终效果如下,可以看到检测到了一个GPU
,并且在执行时能够明显感觉到速度提升了。
此时我们再使用jtop
查看环境,可用看到此时的OpenCV
便是可用使用CUDA
的了。
踩坑
当我们没有下载opencv_contrib代码时,我们在CMake时执行这段编译代码:
会发生报错: