记录重装 ubuntu 18.04 踩的坑
背景:我在主机装了 windows 系统,但是跑代码需要 linux 编译,所以装了双系统,linux 方面选择了 ubuntu 18.04.6 LTS,需要用到的软件为 Anaconda pycharm
专门有一块 512G 硬盘存放 ubuntu 系统,1T 硬盘存放 Windows 系统,1T 硬盘存放工程文件,平常使用 ubuntu 挂载工程文件硬盘进行工作
处理这次事件总耗时 9 小时,如果可以避开这些坑,总耗时不会超过 3 小时。
由于莫名的原因(估计是 nvidia 驱动问题),在一次关机后,再次启动 ubuntu 会卡在登录页面,鼠标和键盘都没有作用。怀疑是显卡驱动的问题,但是在处理的时候不小心删了不该删的东西,对于小白的我来说,最稳妥的方法就是重装系统了,所以首先是进行紧急备份
紧急备份
进入 ubuntu 的 recovery 模式,并选择root那个选项。挂载一个移动硬盘,将 Anaconda 的 envs 文件全部拷贝到移动硬盘,将 CUDA 和一些常用软件安装包拷贝到移动硬盘
参考:
https://blog.youkuaiyun.com/weixin_45761762/article/details/136144666
重装系统
我的启动盘还没有丢掉,所以直接重装,装的时候选择自动安装和最小系统安装。参考:
https://blog.youkuaiyun.com/weixin_44623637/article/details/106723462
由于我的系统和工程文件不在一个盘内,也不需要太大的用户空间,所以直接自动安装,选择最小系统安装,将坏的ubuntu系统盘全部抹除,整个过程用时约10min。
重新配置环境
这次不敢自己安装驱动了,直接使用ubuntu提供的驱动选择,参考:
https://blog.youkuaiyun.com/weixin_44044411/article/details/132752621
之后是重装CUDA环境,从紧急备份中找到CUDA的.run文件,或者官网重新下载,并运行,参考:
https://blog.youkuaiyun.com/str1ngthen/article/details/133793250
配置多版本CUDA切换,参考:
从之前紧急备份的安装包中找到 anaconda 并安装,找到 pycharm 并安装,将备份的 envs 拷贝到新 anaconda 中并activate一次(这很重要)。下面是遇到的问题:
a. 遇到 pip 报错,找不到 python
报错:bash:/root/anaconda3/envs/pytorch_gpu/bin/pip:/home/software/anaconda3/envs/ssast/bin/python:解释器错误: 没有那个文件或目录
这就是迁移后pip无法使用的问题。
解决方法参考:
https://blog.youkuaiyun.com/qq_40933913/article/details/127907916
b. 遇到 libffi.so.8 报错
到所在虚拟环境的 lib 文件夹里搜索,我的是有一个 libffi.so.8.x
的文件,复制然后改名即可
c. 网络连接频繁断开
运行某软件并设置 ubuntu 的网络代理为手动,参考:
https://blog.youkuaiyun.com/Vincentvictory/article/details/134222913
注意,这个需要搭配某软件一起使用!!光改本地是没有用的,请参考上面的连接自行在github上搜索并安装。
d. 报错 libcudart.so.xx
这就是 CUDA 没有配置好,和虚拟环境没有关系,按照上面的方法配置好了,重启一下电脑,大概率问题就消失了。