关于FusionCompute中Ubuntu16.04.5 Server虚拟机安装Nvidia T4 GPU卡

置顶 liuxingyewo

已于 2023-05-09 23:43:46 修改

阅读量2.3k

点赞数

分类专栏：华为文章标签：大数据 ubuntu 机器学习

于 2020-11-08 13:31:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/liuxingyewo/article/details/109558173

版权

华为专栏收录该内容

2 篇文章

订阅专栏

环境如下：

华为FusionCompute，采用虚拟机GPU直通的方式进行部署4块T4卡，全部资源关联给一台虚拟机；

使用的英伟达驱动版本为：NVIDIA-Linux-x86_64-410.104.run

坑点在于：

虚拟化平台本来是6.3.1版本，得知如需使用T4卡，虚拟化平台需升级到8.0.0；后经过评审流程，最终实施升级到了最新8.0.0；但是

我算法平台测试版本为Ubuntu16.04.1 Desktop，经查，虚拟化版本不支持此操作系统，只支持Windows系统相关操作系统，GPU资源组

关联不了测试虚拟机，此刻心中一万个羊驼奔腾而过；继续联系华为处理，后终于得知，版本Ubuntu16.04.5 Server内部测试过可行，

赶紧和算法厂家进行沟通，得知算法平台也支持之后，又在线对虚拟化平台VRM和CNA平台进行了插件升级，终于Ubuntu16.04.5

Server关联到了GPU资源组；

接下来就是安装驱动了！对了，在安装Ubuntu16.04.5时，记得勾选openssh（自己下openssh安装包，老是安装错误）！

将NVIDIA-Linux-x86_64-410.104.run传入/root下

首先需要禁用nouveau；

1.添加conf 文件：cat /etc/modprobe.d/blacklist-nouveau.conf

blacklist nouveau

options nouveau modeset=0

2. 重新生成 kernel initramfs:
update-initramfs -u

3. 重启：
reboot

接下来安装驱动；

chmod -x NVIDIA-Linux-x86_64-410.104.run

sh NVIDIA-Linux-x86_64-410.104.run

安装错误，提醒缺少GCC，此为离线安装，无法上网；也下载了gcc5.4.0，但是安装时依旧报错，最后干脆将镜像挂载，以下参考大神；

关于ubuntu server装上后没有make gcc等的方法_ubuntu gcc 13_竺蠡的博客-优快云博客

这里感谢博主解决了一下大问题！

安装gcc、make后！安装nvidia驱动正常！

不容易啊，撒花。。。。结束！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。