深度学习主机的初步调试(一)
深度学习服务器--馋了小白我四年,之前都是四处借用学校的和实验室的,总是需要协调大家的使用时间,现在深度学习代码训练需要的显存资源也是越来越大,因此趁着疫情电子产品有说降价的时机,一狠心买了一个深度学习的主机。由于之前都是使用的别人现成的环境所以现在买了主机还是得一步一步的再适应和调试一下,这个服务器。服务器的配置是2个技嘉的RTX2080Ti显卡和inter 9代处理器,最初也是抱着试一试的心态从网上购买的,好在卖家售后服务很是热情帮助我解决了不少问题。要不还真是不知道怎么从0开始摆弄这个东西。现在我就记录一下我调试这主机的过程,以便起到一个记录的作用,要是有什么没能考虑到的地方,还望各位大神多多的评论,我好改正和测试。
1. 设备:
硬件:Z390主板+inter i9处理器+2个技嘉RTX2080Ti显卡
系统:预装的Ubuntu18.04系统
从网上买的这个主机的一个好处是系统和显卡驱动都是卖家预先调好的,基本不需要自己再进行安装了,这个对我这个电脑小白来说还是很好的。
需要注意的是为了确保运输图中不会 损坏显卡,一般显卡和主机都是分开发货的,需要自己安装一下显卡。(显卡的供电口已经预留出来了,这一点还是很好的)。基本上插上显卡就可以工作。
我购买深度学习主机的价格并不包含显示器,因此还额外买了一个显示器和装换接口(我买的是HDMI转VGA接口)
2. 使用中遇到的问题
(1)开机之后发现卖家已经预先定义了一个用户和密码
这个问题我是通过找卖家要了用户密码,之后又修改了root用户的密码而实现的。
(2)重启之后提示更新内核和程序,但更新之后发现报“检测到系统程序出现问题”

可以打开终端,输入如下代码:
sudo gedit /etc/default/apport
将文件中的enabled=1,修改为0,然后保存,这样就不会再推系统程序出现问题了。
(3)更新之后发现,显卡的驱动没了。再输入nvidia-smi会报错,“NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.”

经过和卖家联系,很快的解决了这个问题,(这个售后还是比较靠谱的)。
--》
--》
找到软件和更新--》附加驱动--》选择指定的这个专有驱动(因为之前预装的系统是有显卡驱动的)--》静静的等待
最后是重启大法。
重启之后图标就变小了,分辨率也变清晰了,驱动也有了,nvidia-smi也不报错了。
目前调试到了这一步,未完待续啊。。。。。
1098

被折叠的 条评论
为什么被折叠?



