BACKGROUND:安装 sklearn 包时,一见到底导致python环境重叠了,然后pip一键卸载sklearn包时,悲剧就发生了,原来的代码各种错误运行不了,conda错,activate错,python错,各种错,简直要崩溃了。本人装环境小白,无奈之下只好破釜沉舟,把所有的环境都给卸载掉清理干净了,重新安装。
1. 安装anaconda3:因为我的服务器上有之前下载好的sh文件,所以直接bash /home/.../.../Anaconda3-5.0.1-Linux-x86_64.sh,这一步无所谓在哪儿操作,只要登录到server端就行
一直敲回车,然后选yes,然后允许默认路径
此时就可以看到 /home/user/anaconda3文件夹了
同时也可以 source /etc/profile conda list 查看是否已安装成功
重点来了:进行环境变量配置
sudo vi /etc/profile 输入密码后进入文件编辑
输入上述命令后再输入i,在文件末尾加上 export PATH=$PATH:/home/software/anaconda3/bin
按下ESC键,输入: wq按下回车就保存退出了
记得要重新载入配置文件:source /etc/profile
至此:环境变量就配置好,可以在终端输入python or python3 看是否成功
2. 创建虚拟环境(非必要步骤,个人习惯了,我是用conda创建的)
conda create -n aiai python=3.7 创建了一个python为3.7名称为aiai的虚拟环境
特别注意:此时的虚拟环境并不是在 /home/user/.virtualenvs ,
而是在 /home/user/anaconda3/envs/aiai/...
3. 安装包: 进入到虚拟环境 source activate aiai 就可以安装torch的各种包了
首先要查看一下cuda的版本: nvcc -V
然后再 https://pytorch.org/ 找到合适的torch版本,直接复制框里的命令就可以安装了
然后,悲剧接着发生了。。。进入到tmux后,python运行文件又一次报错了,输入ls,提示bash: ls: command not found,无法使用Linux命令。查看python和torch都是正常的,此时此刻!真的要崩溃了!!
好在我又一次没放弃!!一边吐血一边找bug!!最后发现是环境变量的问题,直接命令行输入 export PATH=/bin:/home/xxx/anaconda3/envs/ai/bin:$PATH 这个错误就可以解决了。
然后另一个错误又出现了!!显示cuda driver版本太低,需要升级,其实也就是因为我安装的torch版本太高,所以在安装torch之前一定要看好自己cuda的版本啊!在 https://pytorch.org/get-started/previous-versions/ 里能查到较低版本的cuda对应的torch和torchvision版本(cuda8.0, cuda7.0+的都有)
我的cuda版本nvcc -V 查看: Cuda compilation tools, release 8.0, V8.0.61 (至于我为什么会装错torch,因为我第一查到的cuda版本是9.0,所以直接pip了上面截图中红色框框里的command。运行报错的时候,我又一次查了cuda version,竟然是8.0了??!!又一次气吐血了……)
然后(在虚拟环境里)
先卸载之前的版本: pip uninstall torch
重新安装: pip install torch==1.0.0 torchvision==0.2.1
终于又一次看见successful了!!
此时!进入tmux就可以正常运行,血槽也空了!!!整理完感觉步骤也没多少,但真的是一步无数个坑踩过来的!(灬ꈍ ꈍ灬) 很好!我现在也可以自己配环境了!
(PS: 进入tmux之前我已经在虚拟环境了,进入tmux之后,需要再source activate XXXX一次,不知道为啥,不管了,不报错就行!!)