OpenStack GPU直通服务器

最新推荐文章于 2025-11-25 11:32:35 发布

原创

最新推荐文章于 2025-11-25 11:32:35 发布 · 2.7k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#服务器 #openstack #GPU

本文详细介绍了OpenStack环境下实现GPU直通的技术特性，包括操作系统支持、设备兼容性和部署步骤，如BIOS设置、IOMMU配置、vfio模块的使用，以及OpenStack配置和GPU云服务器的验证。此外，还讨论了NVIDIA显卡的兼容性问题和解决方法。

layout: post
title: OpenStack GPU直通服务器
catalog: true
tag: [OpenStack, GPU]

1. 概述
2. 直通GPU特性
3. 功能说明
- 3.1. 操作系统支持
- 3.2. 设备支持
4. 实现方案
5. 部署方案
- 5.1. 示例环境说明
- 5.2. 上线步骤
6. 常见问题
- 6.1. NVIDIA显卡的问题
7. 参考

1. 概述

直通GPU 云服务器（GPU Virtual Machine）是基于 GPU 的快速、稳定、弹性的计算服务，主要应用于深度学习训练\推理、图形图像处理以及科学计算等场景。
直通GPU 云服务器提供和标准云服务器一致的方便快捷的管理方式，相对于vGPU云服务器，直通GPU使用的PCI透传技术能带来几乎和物理设备同等的性能。

2. 直通GPU特性

直通GPU具备以下产品特点

租户独享物理GPU，可利用几乎与物理设备同等的性能。
直通GPU 云服务器位于云内部网络，内网时延低，提供优秀的计算能力。

3. 功能说明

3.1. 操作系统支持

直通GPU云服务器支持Windows和Linux操作系统。

3.2. 设备支持

支持主流厂商PCI插槽的GPU卡。

4. 实现方案

直通GPU云服务器采用了PCI Passthrough技术，将宿主机上某个PCI槽位透传给虚拟机使用，GPU卡即安装在PCI卡槽上，如下图：

在这里插入图片描述

PCI直通特性允许虚拟机完全访问与直接控制物理PCI设备。此机制对任何类型的PCI设备都是通用的，并且可以与网络接口卡（NIC），
图形处理单元（GPU）或可以连接到PCI总线的任何其他设备一起运行，在PCI直通的情况下，整个物理设备只能分配给一个虚拟机，并且不能共享。
各组件的关系如下：

在这里插入图片描述

5. 部署方案

5.1. 示例环境说明

组件	版本	备注
GPU	NVIDIA A100
操作系统版本	CentOS Linux release 7.8.2003 (Core)
内核版本	3.10.0-1127.el7.x86_64
OpenStack版本	Train

5.2. 上线步骤

5.2.1. 硬件安装

按照相关指导安装显卡至计算节点
如有问题需要向显卡厂商寻求协助
注:英伟达服务器支持列表：
https://www.nvidia.com/object/vgpu-certified-servers.html
一般情况下，单独划分GPU AZ，如果存在不同型号的GPU，则划分更新的AZ。

5.2.2. GPU计算节点主机配置

5.2.2.1. IOMMU设置

5.2.2.1.1. BIOS设置

在BIOS中enable VT-x, VT-d, Onboard VGA. Onboard VGA 的enable可以避免一些错误的出现，具体参考Not only for miners GPU integration in Nova environment.

5.2.2.1.2. grab设置

编辑文件 /etc/default/grub

如果没有 GRUB_CMDLINE_LINUX_DEFAULT 则编辑 GRUB_CMDLINE_LINUX

对于Intel芯片：GRUB_CMDLINE_LINUX_DEFAULT=“intel_iommu=on”
对于AMD芯片：GRUB_CMDLINE_LINUX_DEFAULT=“iommu=pt

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。