dlib的gpu环境配置

本文详细介绍如何在Ubuntu环境下配置Dlib使用GPU加速,包括NVIDIA驱动、CUDA、cuDNN的安装步骤,以及通过源码编译Dlib并开启GPU支持的方法。同时,文章还提供了使用openblas优化库作为备选方案,显著提升人脸特征提取效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景

dlib默认的是只在cpu上,但是在cpu上一张图像进行人脸检测以及特征提取需要2.5秒左右,很显然不能满足需求,所以我们需要dlib配置成提供gpu的环境。

gpu环境

nvidia驱动

本身自带有驱动。

cuda

wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_9.1.85-1_amd64.deb
​
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub
​
sudo dpkg -i cuda-repo-ubuntu1604_9.1.85-1_amd64.deb
sudo apt-get update
sudo apt-get install cuda-9.1
reboot
vim ~/.bashrc
export PATH=/usr/local/cuda-9.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
source ~/.bashrc
sudo ldconfig
nvidia-smi
没有报错,说明安装成功。

nvcc

nvcc是cuda的开发工具,可以使用下面的命令进行安装:

apt-get install nvidia-cuda-toolkit
安装完成输入nvcc没有报错,则说明安装成功。

cudnn

除了安装cuda,cudnn也是必须的。

基本上所有的深度学习框架都支持cuDNN这一加速工具,例如:Caffe、Caffe2、TensorFlow、Torch、Pytorch、Theano等。

Caffe可以通过修改Makefile.config中的相应选项来修改是否在编译Caffe的过程中编译cuDNN,如果没有编译cuDNN的话,执行一些基于Caffe这一深度学习框架的程序速度上要慢3-5倍(Caffe官网上说不差多少,明明差很多嘛)。Caffe对cuDNN的版本不是很严格,只要大于cuDNN 4就可以。

cudnn安装比较简单,可以参考:

https://www.jianshu.com/p/e22866b72f43

配置

通过pip安装的dlib是没有打开gpu的,需要我们下载源码,手动进行编译。

git clone https://github.com/davisking/dlib.git
cd dlib
mkdir build
cd build
cmake .. -DDLIB_USE_CUDA=1 -DUSE_AVX_INSTRUCTIONS=1
cmake --build .
cd ..
python setup.py install --yes USE_AVX_INSTRUCTIONS --yes DLIB_USE_CUDA

在编译的时候提示下面的错误:

CUDA_TOOLKIT_ROOT_DIR not found or specified
-- Could NOT find CUDA (missing:  CUDA_TOOLKIT_ROOT_DIR CUDA_NVCC_EXECUTABLE CUDA_INCLUDE_DIRS CUDA_CUDART_LIBRARY)

这是因为dlib发现不了上面四个目录,需要安装或者配置目录。

1.确保nvcc已经安装,没有安装的话可以用下面的命令:

apt-get install nvidia-cuda-toolkit
如果nvcc成功,说明nvidia-cuda-toolkit安装成功。

2.cmake .. -DDLIB_USE_CUDA=1 -DUSE_AVX_INSTRUCTIONS=1 -DCMAKE_PREFIX_PATH=/usr/local/cuda编译出错,提示找不到CUDA_cublas_LIBRARY,CUDA_curand_LIBRARY和cusolver,

将路径加上。

cmake .. -DDLIB_USE_CUDA=1 -DUSE_AVX_INSTRUCTIONS=1 -DCMAKE_PREFIX_PATH=/usr/local/cuda -DCUDA_cublas_LIBRARY=/usr/local/cuda/lib64/libcublas.so.9.0.176 -DCUDA_curand_LIBRARY=/usr/local/cuda/lib64/libcurand.so.9.0.176 -Dcusolver=/usr/local/cuda/lib64/libcusolver.so.9.0.176
  1. 继续编译,出现下面的问题:

 

解决:

网上说是gcc版本的问题,ubuntu16.04使用gcc5,需要升级到gcc6,但是16.04源里面没有gcc6,如果用源码编译会遇到各种问题,所以使用ubuntu18.04。

 

测试

python
import dlib
dlib.DLIB_USE_CUDA
如果输入为True,则说明gpu加载成功。

如果dlib的gpu环境实在编译不成功,可以尝试oenblas优化库,

apt-get install libatlas-base-dev libopenblas-dev liblapack-dev

有了openblas,可以使人脸特征提取时间缩短一倍以上,由原来的2.5秒变为1s左右。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值