【框架】:ubuntu1604+opencv340+anaconda2+caffe(+pycaffe)
前面细节准备工作可以看这几篇:
https://mp.youkuaiyun.com/postedit/81120722
https://mp.youkuaiyun.com/postedit/81120934
https://mp.youkuaiyun.com/postedit/81120953
主要参考这两篇https://blog.youkuaiyun.com/jiangyanting2011/article/details/78873113
https://blog.youkuaiyun.com/u012029332/article/details/51098248
主要放些遇到的问题和解决办法。
常见问题1:权限不够时,比如出现permmision字眼,那么需要在命令前面加上sudo,取得管理员权限(在遇到无法找到路径,无法创建文件时,都可以先试着加sudo权限)
常见问题2:报错有cudnn时,可能是gpu计算能力不够,在Makefile.config里把cudnn=1注释掉(我笔记本电脑就无法用cudnn)
关于如何看显卡计算力:可以在编译完cuda后,用 ./deviceQuery看;可以在matlab里面输入gpuDevice看
比如我的,笔记本的geforce820m是2.1的计算力;主机的gtx760是3.0的计算力
在make clean后需要重新make all -jx(x是你的计算机核数)然后再make runtest测试。
可能最后还需要将/usr/local/lib /usr/lib /usr/local/cuda/lib64 /usr/local/cuda-8.0/lib64
全部加入到/etc/ld.so.conf然后sudo ldconfig以写全路径。
最后的结果需要执行下面几句不报错
sudo make all -j4
sudo make test -j4
sudo make runtest -j4
sudo make pycaffe -j4 (如果需要python)
注意,如果需要在python中使用,则需要编译pycaffe,这在参考的博客里面没有提到可能,即在caffe目录下make pycaffe。
两种方法使用,方法1:打开python(实际打开anaconda2)
import sys
caffe_root = '../' # this file should be run from {caffe_root}/examples (otherwise change this line)
sys.path.insert(0, caffe_root + 'python')
import caffe
# If you get "No module named _caffe", either you have not built pycaffe or you have the wrong path.
方法2:配置python运行环境
vim ~/.bashrc
#添加下面内容
export PATH="/home/yourname/anaconda2/bin:$PATH"#这里时安装anaconda时系统默认存在的
export PYTHONPATH="/home/yourname/caffe/python:$PYTHONPATH"#设置caffe下的路径,注意修改下自己的路径否则caffe也找不到。
#保存后,更新并执行
source ~/.bashrc
方法2在使用时就是直接打开python(实际打开anaconda2),然后直接import caffe不报错即可。
注意,当然很有可能make pycaffe失败,比如
问题1.Makefile594:recipe for target '.build_realease/cuda/src/caffe/layers/lrn_layer.o'failed.....在这句上面报错里面提及到anaconda2和protobuf的字眼
这个时候我是将Makefile.config里的有关anaconda注释掉而把python反注释,可以解决,按理说我这步操作应该是将caffe配置了原生态的python接口而不是anaconda接口,但我用anaconda2版本却能够成功import caffe,可能因为已经把原生态的python与anaconda2链接起来了?真实原因不知,希望之后能了解到回来填坑。但是makefile.config屏蔽anaconda会带来新问题可能,因为我们毕竟还是使用的anaconda2的,比如非常可能出现问题2
问题2.在make runtest时出现error while loading shared libraries:libhdf5_hl.so.100:can not open shared object file........
这个时候我是去~/.bashrc里面看是不是有配置好环境,需要有这句
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/yourname/anaconda2/lib
这个是把anaconda2路径添加到环境变量,不需要原有的
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/user/local/lib
有这句的话将其注释掉。
问题3.然后也很有可能在import caffe会出现 no module named google.protobuf.internal
这个时候很多地方都或许会说
sudo pip install protobuf
但这个是针对你用的是系统的python环境,而我们是用的anaconda2这个python集成环境,我们需要在终端窗口输入
conda install protobuf
附上我的makefile文件:https://download.youkuaiyun.com/download/vahalla233/10606050
ubuntu1804直接一句命令:
sudo apt install caffe-cpu
或者sudo apt install caffe-cuda
编译的文件(例如caffe.cpp以及tools下的文件)都编译好了放在usr/bin里面,可以在终端里面不输入到其他目录下,直接写caffe命令,比如微调的caffe train --solver xxxx,再比如使用原来自带的tool的convert_imageset xxxxx
用python调用时必须python3.6或2.7这种自带的,而不是anaconda带的python版本,在系统python里面import caffe
安装tensorflow直接pip3 install tensorflow-gpu==1.4(指定配合cuda的版本号)
使用时,需要额外注意将cuda-x.y的路径配置到~/.bashrc末尾,比如配置cuda9.0:
#cuda-9.0
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64
export PATH=$PATH:/usr/local/cuda-9.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-9.0
没有把cuda环境配置好会出现cudaxxx.so.xxxx之类的错误!