【涉及到的内容】:
- Ubuntu1404的安装
- 安装cuda7.5.run
- 编译caffe的C++, python, Matlab接口
- 配置远程登陆(SSH,VNC)
- 配置py-faster-rcnn
- FTP配置
【1. Ubuntu14.04的安装】
安装系统没有什么难的,此外,现在基于linux做深度学习开发的主流系统版本就是1404,问题少,好配置。这些有点足够了,那么我要说的是安装完系统以后可能会出现的问题。比如: sudo apt-get update 之后会出现Hash mismatch 等这样的错误。
问题原因:出现这样的错误是网络问题造成的,如果忽略不好,后面安装一些东西会报各种各样的问题。
解决办法:我是用手机4G开的热点,然后服务器插上无线网卡,用手机流量update的(一把心酸泪啊!!),知道update成功,一般也就30M左右的流量。
【2. 安装cuda-7.5】
安装cuda-7.5 常用的方式有两种:一种是用包管理器deb安装,另一种是用run文件安装。
1)我之前一直用deb方式安装,优点是操作简单而且问题少,安装方式如下:
$ sudo dpkg -i cuda-repo-<distro>_<version>_<architecture>.deb
$ sudo apt-get update
$ sudo apt-get install cuda #如果update 成功 则 这步就一定会成功。
在安装完成后记得重启电脑,驱动才能有效。
$ sudo reboot
然后编译cuda自带的Samples,运行deviceQuery 的demo就可以看到结果。
2)如果重启之后你进不去系统了,也就是卡在登陆密码的界面,一输入密码之后黑屏一下,然后又退回到登陆界面。这种问题叫login loop
问题原因:显卡驱动安装失败。
解决办法:网上有很多,但是都没有解决,最后我选择重装系统,用run文件安装cuda。
(注:用run文件安装真的很麻烦,但是最后work了,这就是管用的)
- 以终端的方式登陆系统(ctrl+Alt+F2)
- 查看nouveau的驱动,如果有任何打印的信息就说明他还工作着
$ lsmod | grep nouveau
- 将nouveau加入黑名单,失能它
$ vi /etc/modprobe.d/blacklist-nouveau.conf
##############---blacklist-nouveau.conf file---------
blacklist nouveau
options nouveau modeset=0
###########----blacklist-nouveau.conf file Done---------
- 重新生成kernel
$ sudo update-initramfs -u
- 重启服务器,然后再查看一遍nouveau的驱动是否还在,如果什么都没有打印就说明禁止成功了。
- 禁止nouveau成功以后再次以终端的方式登陆系统
- 禁止X-window服务
$ sudo service lightdm stop
- 安装cuda-7.5_XXX.run 文件
$ sudo ./{file_location}/cuda-7.5_XXX.run
安装的时候会先让你看一遍协议,你看空格快速看就ok,然后是一些选项,除了openGL那个是NO以外,其他的都是默认或者接受。
- 打开X-Windows服务
$ sudo service lightdm start
- 重启电脑
$ sudo reboot
---[Uninstall CUDA]
To uninstall the CUDA Toolkit:
$ sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
To uninstall the CUDA Driver :
$ sudo /usr/bin/nvidia-uninstall
【3. caffe的配置】
没有什么难的,网上一堆,有时间再自己写。。。
【4.远程登陆】
1.SSH 参考百度经验配置,相当简单
2.VNC
需要安装vnc4server
# sudo apt-get install vnc4server
安装vnc使用gnome桌面,因为它的配置简单,和ubuntu自带的unity桌面也很像# sudo apt-get install gnome-panel gnome-settings-daemon # sudo apt-get install metacity nautilus gnome-terminal
然后启动vncserver# vncserver :1
然后会在~目录下出现.vnc的文件夹修改 ~/.vnc/xstartup 文件,如下:
关闭vncserver以后重新启动
# vncserver -kill :1 # vncserver :1
到此,服务器端配置结束。
【5. py-faster-rcnn的配置】
遇到的问题: 安装scipy失败
问题的原因: 因为scipy需要gfortran编译, 因为新系统里面没有,所以会报错。
解决方法: 1)先 sudo apt-get install gfortran
2)再 pip install scipy
遇到的问题: Check failed: error == cudaSuccess (8 vs. 0) invalid device function
问题的原因: 显卡的计算能力和默认的不匹配
解决方法: http://blog.youkuaiyun.com/u013078356/article/details/51009470
【6. FTP配置】
按照网上的教程配置好FTP以后,在通过ftp向服务器上传文件的时候遇到如下问题:
ftp> put lenet_solver.prototxt /home/yue/uftp
200 PORT command successful. Consider using PASV.
553 Could not create file.
解决办法:
$ sudo mkdir /var/ftp/write
$sudo chmod -R 777 /var/ftp/write$sudo gedit /etc/vsftpd.conf ##然后修改vsftp的配置文件/etc/vsftpd.conf文件
在最后添加上
local_root=/var/ftp$sudo service vsftpd restart ##保存,然后杀死vsftpd进程,然后重启vsftpd服务器程序。
附FTP的一些基本操作:
>>> ftp XXX.XXX.XXX.XXX
用户名:。。
密码:。。
>> lcd 路径 #移动到本地目录
>> cd 路径 #移动服务器到路径
>>put file 路径 # 将本地文件 上传到服务器
>>get #从服务器上下载文件到本地。