Ubuntu16.04.1安装Caffe(GPU)

本文提供了一份详细的Caffe安装教程,涵盖了Ubuntu系统环境搭建、依赖库安装、显卡驱动及CUDA/CUDNN配置等内容。

Caffe的优势:

1.上手快:模型与相应优化均以文本形式而非代码形式给出,caffe给出了模型的定义,最优化设置以及预训练的权重

2.速度快:与CuDNN结合使用,测试AlexNet模型,在K40上处理每张图只需1.17ms

3.模块化:方便扩展到新任务,设置上可以使用caffe提供的各层类型来定义自己的模型

4.开发性:公开的代码与参考模型用于再现

5.社区好:可以通过BSD-2参于开发与讨论。

安装Caffe注意:

双显卡不适合安装caffe,因为通常集成显卡不能切断,而桌面的图像必须有集成显卡控制,导致NVIDIA显卡驱动安装后桌面黑屏;

不同显卡驱动对应不同的CUDA,例如:GTM550-CUDA6.5.14;K5000-CUDA7.0.28;

如果出现不存在该文件或找不到文件的情况,很可能是因为终端定位的目录错误,可以借助[Tab]键;

安装完Ubuntu后关闭自动更新,若其自动更新了显卡驱动,可能会与caffe不兼容;

安装过程,因为平台不同,设备不同,操作者不同,会遇到各种奇怪的问题与报错信息;

14.04.5内核版本过高,gcc编译不通过,14.04.4及其以下可以正常编译,否则安装显卡驱动时会:

The driver installation is unable to locate the kernel source. Please make sure that the kernel source packages are installed and set up correctly.
If you know that the kernel source packages are installed and set up correctly, you may pass the location of the kernel source with the '--kernel-source-path' flag.

M2000以及M4000\6000等新型显卡cuda7.5无法检测,导致系统找不到cuda设备,需要安装cuda8.0,安装过程与7.5相同。

1、安装Ubuntu-16.04.1-desktop-amd64

2、下载NVIDIA-Linux-x86_64-375.66.run

   下载cuda_8.0.61_375.26_linux.run

   下载cudnn-8.0-linux-x64-v5.1.tgz

      下载caffe-master

3、检查自己的GPU是否是CUDA-capable

xtu@xtu-Precision-Tower-7910:~$ lspci | grep -i nvidia
03:00.0 VGA compatible controller: NVIDIA Corporation Device 1b00 (rev a1)
03:00.1 Audio device: NVIDIA Corporation Device 10ef (rev a1)

会显示NVIDIA GPU版本信息,具体信息可以查询一下官网或者百度一下cuda支持的显卡列表。 

4、安装基本依赖库

sudo apt-get install build-essential   
sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libboost-all-dev libhdf5-serial-dev libgflags-dev libgoogle-glog-dev liblmdb-dev protobuf-compiler 

5、检查自己的系统中是否装了GCC,为避免与编译器版本不兼容问题,保证GCC/G++版本5.0以上

xtu@xtu-Precision-Tower-7910:~$ gcc -v %gcc --version
Thread model: posix
gcc version 5.4.0 (Ubuntu 5.4.0-6ubuntu1~16.04.4) 

没有的话可以通过 sudo apt-get install gcc安装。 或者gcc/g++版本低于5.0,升级到5.0以上

下载安装gcc/g++-5

sudo add-apt-repository ppa:ubuntu-toolchain-r/test  
sudo apt-get update  
sudo apt-get install gcc-5  
sudo apt-get install g++-5

改变系统默认的gcc/g++编译器版本,换成gcc/g++-5

sudo su  
cd ../../usr/bin  
ln -s /usr/bin/g++-5 /usr/bin/g++ -f  
ln -s /usr/bin/gcc-5 /usr/bin/gcc -f 

这样,gcc就默认成gcc-5,g++也默认成g++-5了

6、检查是否安装了kernel header和 package development

xtu@xtu-Precision-Tower-7910:~$ uname -r
4.4.0-81-generic

 更新系统kernel:

$ sudo apt-get install linux-headers-‘uname -r‘ (uname -r 是系统kernel全名)

安装头文件及编译环境:

sudo apt-get install linux-headers-$(uname -r) build-essential %sudo apt-get install linux-headers-$(uname -r)

查看kenerl-source-path: 

ysp@ysp-Precision-Tower-7910:~$ uname -r
4.4.0-83-generic
ysp@ysp-Precision-Tower-7910:~$ cd /usr/src
ysp@ysp-Precision-Tower-7910:/usr/src$ ls
linux-headers-4.4.0-31          linux-headers-4.4.0-83
linux-headers-4.4.0-31-generic  linux-headers-4.4.0-83-generic

7、禁用nouveau

ubuntu自带的nouveau驱动会影响cuda安装,不当操作会导致黑屏和登陆循环。 终端运行:

xtu@xtu-Precision-Tower-7910:~$ lsmod | grep nouveau
nouveau              1474560  0 
mxm_wmi                16384  1 nouveau
video                  40960  1 nouveau
ttm                    94208  1 nouveau
drm_kms_helper        151552  1 nouveau
drm                   360448  3 ttm,drm_kms_helper,nouveau
wmi                    20480  2 mxm_wmi,nouveau
i2c_algo_bit           16384  2 igb,nouveau

如果有输出则代表nouveau正在加载。则需要禁用nouveau,在/etc/modprobe.d中创建文件blacklist-nouveau.conf,再用getid打开

xtu@xtu-Precision-Tower-7910:~$ cd /etc/modprobe.d
xtu@xtu-Precision-Tower-7910:/etc/modprobe.d$ sudo touch blacklist-nouveau.conf
[sudo] password for xtu: 
xtu@xtu-Precision-Tower-7910:/etc/modprobe.d$ sudo gedit blacklist-nouveau.conf
在文件中输入以下内容并保存:
blacklist nouveau  
options nouveau modeset=0 

之后更新

sudo update-initramfs -u

这种方式也可能不能彻底禁用nouveau,在此基础上可以移除以下文件:nouveau.ko;nouveau.ko.org,此文件一般是隐藏的具体操作

cd /lib/modules/4.4.0-83-generic/kernel/drivers/gpu/drm/nouveau 
sudo rm -rf nouveau.ko
sudo rm -rf nouveau.ko.org

再更新

sudo update-initramfs –u

此时重启,再用终端检测一下

lsmod | grep nouveau

没有输出即为禁用成功。

8、驱动安装(Nvidia的显卡+Intel的集显 - 循环登录问题)

1) 卸载掉原有驱动

sudo apt-get remove --purge nvidia-*

2) Ctrl+alt+F1进入字符界面,关闭图形界面

sudo service lightdm stop

此时可能关不了,即使现实该操作OK,但是一会再开启时会有问题,可以在此基础上增加操作,手动删除X图像界面,图像界面X/tmp路径下,具体操作:

cd /tmp  
sudo rm -rf .X*

这样就可以把关于X的图像界面文件全部删除(每次重启都会再次生成,所以会在alt+ctrl+f1界面下操作)

3) 安装nvidia driver

sudo chmod a+x NVIDIA-Linux-x86_64-375.66.run //获取权限
sudo ./NVIDIA-Linux-x86_64-375.66.run –no-x-check –no-nouveau-check –no-opengl-files //安装驱动
  • –no-x-check 安装驱动时关闭X服务
  • –no-nouveau-check 安装驱动时禁用nouveau
  • –no-opengl-files 只安装驱动文件,不安装OpenGL文件

Accept->Continue installation->sign the kernel module(为内核模块签名)?选择是->使用已有的密钥给模块签名还是重新生成?选重新生成密钥->是否删除已生成的密钥文件?选择否->安装完成

问题:The target kernel has CONFIG_MODULE_SIG set,which means that it supports cryptographic signatures on kernel module. On some systems, the kernel may refuse to load modules without a valid signature from a trusted key.This system also UEFI Secure Boot enabled; many distributions enforce module signature verification on UEFI systems when Secure Boot is enabled. Would you like to sign the NVIDIA kernel module?

解决:禁用UEFI安全启动功能

启动电脑,然后按电脑的设置访问UEFI,本机器按[F2]键,不同的制造商可能有不同的设置,具体请参考主板说明书。

根据不同的UEFI版本,安全启动选项通常在一个选项卡下,这个选项卡可能被命名为“Boot”、“Security”或者“Authentication”,在类似的选项卡中查找,我们会发现一个“Secure Boot”选项,该选项默认设置为“Enabled”,选中它并回车,将其设置为“Disabled”,按[Apply]键存储设置,重新启动电脑即可安装我们需要的操作系统。

9安装Cuda8.0

1) 继续Ctrl+alt+F1进入的字符界面

2) cd.run 文件所处的路径下,安装nvidia driver

sudo chmod +x cuda_8.0.61_375.26_linux.run
sudo sh cuda_8.0.61_375.26_linux.run --tmpdir=/tmp

按照步骤安装,第一个就是问你是否安装显卡驱动,由于前一步已经安装了显卡驱动,所以这里就不需要了,况且 runfile 自带的驱动版本不是最新的。

Do you accept the previously read EULA?
accept/decline/quit: accept

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 361.62?
(y)es/(n)o/(q)uit: n
Install the CUDA
8.0 Toolkit? (y)es/(n)o/(q)uit: y Enter Toolkit Location [ default is /usr/local/cuda-8.0 ]: Do you want to install a symbolic link at /usr/local/cuda? (y)es/(n)o/(q)uit: y Install the CUDA 8.0 Samples? (y)es/(n)o/(q)uit: y Enter CUDA Samples Location [ default is /home/zhou ]: Installing the CUDA Toolkit in /usr/local/cuda-8.0 … Missing recommended library: libGLU.so Missing recommended library: libX11.so Missing recommended library: libXi.so Missing recommended library: libXmu.so Installing the CUDA Samples in /home/zhou … Copying samples to /home/zhou/NVIDIA_CUDA-8.0_Samples now… Finished copying samples. =========== = Summary = =========== Driver: Not Selected Toolkit: Installed in /usr/local/cuda-8.0 Samples: Installed in /home/xtu, but missing recommended libraries Please make sure that - PATH includes /usr/local/cuda-8.0/bin - LD_LIBRARY_PATH includes /usr/local/cuda-8.0/lib64, or, add /usr/local/cuda-8.0/lib64 to /etc/ld.so.conf and run ldconfig as root To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-8.0/bin Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-8.0/doc/pdf for detailed information on setting up CUDA. ***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 361.00 is required for CUDA 8.0 functionality to work. To install the driver using this installer, run the following command, replacing with the name of this run file: sudo .run -silent -driver Logfile is /tmp/cuda_install_18572.log

最后你会看到cuda驱动、sampletookit已经安装成功,但是缺少一些库。

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev

10安装Cudnn5.1

1) 继续Ctrl+alt+F1进入的字符界面

2) 进入解压后的cudnn-8.0-linux-x64-v5.1.tgz文件cuda,在终端执行下面的指令安装:

tar -zxvf cudnn-8.0-linux-x64-v5.1.tgz
cd cuda sudo cp lib64
/lib* /usr/local/cuda/lib64/ sudo cp include/cudnn.h /usr/local/cuda/include/

然后更新网络连接:

cd /usr/local/cuda/lib64/  
sudo chmod +r libcudnn.so.5.1.10  # 自己查看.so的版本  
sudo ln -sf libcudnn.so.5.1.10 libcudnn.so.5  
sudo ln -sf libcudnn.so.5 libcudnn.so  
sudo ldconfig  

重新启动图形化界面

sudo service lightdm start

Ctrl+alt+F7退出Text Mode。

11、添加环境变量

编辑计算机文件夹下的/etc/profile,加入CUDA环境变量,保存

sudo gedit /etc/profile
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

 

保存后执行下面的命令,使其生效:

source /etc/profile  

同时,进入/etc/ld.so.conf.d/文件夹,执行下面的命令,新建一个名为cuda.conf的文件,然后在文件中写入内容:

cd /etc/ld.so.conf.d/
sudo gedit cuda.conf
/usr/local/cuda/lib64   

保存后执行下面的命令,使其生效

sudo ldconfig 

12、检验驱动是否安装成功

a)重启电脑检查环境变量配置

env

b)检查 NVIDIA Driver是否安装成功

nvidia-smi

c)检查 CUDA Toolkit是否安装成功

nvcc -V //会输出CUDA的版本信息

d)测试cuda的samples

1.编译cuda提供的例子,build samples

cd ~/NVIDIA_CUDA-8.0_Samples % cd /home/xtu/NVIDIA_CUDA-8.0_Samples
sudo make all -j8

2.运行编译生成的二进制文件,编译后的二进制文件默认存放在~/NVIDIA_CUDA-8.0_Samples/bin中,进入samples/bin/x86_64/linux/release目录下,在终端执行查询命令:

cd ~/NVIDIA_CUDA-8.0_Samples/bin/x86_64/linux/release/
./deviceQuery

如果返回了你电脑显卡的信息,且结尾有Result=PASS,则表示安装成功,否则,建议重启电脑之后再次尝试查询命令

3.在samples/bin/x86_64/linux/release目录下,再检查系统和CUDA-Capabledevice的连接情况

./bandwidthTest

13安装Atlas

sudo apt-get install libatlas-base-dev

14安装OpenCv

下载Opencv安装包,解压后进入目录Install-OpenCv/Ubuntu/2.4,然后执行安装文件

cd ~/Install-OpenCv/Ubuntu/2.4/
sh sudo ./opencv2_4_10.sh

15配置Python环境

解压caffe-master,打开Makefile文件,修改下面的两个地方

INCLUDE_DIRS += $(BUILD_INCLUDE_DIR) ./src ./include  
改成:
INCLUDE_DIRS += $(BUILD_INCLUDE_DIR) ./src ./include /usr/include/hdf5/serial 
LIBRARIES += glog gflags protobuf boost_system boost_filesystem m hdf5_hl hdf5  
改成:
LIBRARIES += glog gflags protobuf boost_system boost_filesystem m hdf5_serial_hl hdf5_serial 

保存之后,进入caffe-master/python文件,在终端执行下面的命令

cd ~/caffe-master/python
sudo apt-get install python-pip python-dev build-essential  
sudo pip install --upgrade pip  
sudo pip install -r ./requirements.txt

16编译Caffe

进入caffe-master文件夹,复制配置文件,留一个备份

cp Makefile.config.example Makefile.config

然后打开Makefile.config文件,修改配置,把注释去掉,修改数字

USE_CUDNN := 1  
USE_OPENCV := 1  
USE_LMDB := 1  
CUSTOM_CXX := g++  
WITH_PYTHON_LAYER := 1

再进行编译

make all -j8
make test -j8
make runtest -j8
make pycaffe -j8 

如果没有报错,那基本上就安装成功。

问题:Error: /home/xtu/anaconda2/bin/../lib/libstdc++.so.6: version `GLIBCXX_3.4.21' not found (required by /home/xtu/caffe/python/caffe/_caffe.so)

解决:这是因为编译库的编译器和编译当前程序的编译器版本不一致,具体因为是当前程序的编译器的版本比较低,只要升级即可。

先查看当前GCC版本

strings /home/xtu/anaconda2/bin/../lib/libstdc++.so.6 | grep GLIBCXX

确实没有GLIBCXX_3.4.21,需要找编译库的编译器版本

find / -iname libstdc++.so.6.0.2* //找到最新版本存在的文件夹
strings /usr/lib/x86_64-linux-gnu/libstdc++.so.6.0.21 | grep GLIBCXX //查看该文件夹存不存在

存在,则将该版本拷到之前的目录下

cp /usr/lib/x86_64-linux-gnu/libstdc++.so.6.0.21 /home/xtu/anaconda2/bin/../lib/

再到之前的目录,删除原来的libstdc++.so.6,并建立软连接

cd /home/xtu/anaconda2/bin/../lib/  
rm -rf libstdc++.so.6  //删除原来的
ln -s libstdc++.so.6.0.21 libstdc++.so.6  //建立软链接

再次查看已存在

strings /home/xtu/anaconda2/bin/../lib/libstdc++.so.6 | grep GLIBCXX

 

转载于:https://www.cnblogs.com/5211314jackrose/p/7081020.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值