horizon2206+A6000显卡 vGPU桌面经验分享

本文分享了一位工程师在搭建VMware vsan+horizon2206+A6000显卡 vGPU桌面过程中遇到的问题及解决方法,包括服务器BIOS设置、LUMION基准测试低分问题及解除FRL限制、内存超过32G导致的云桌面黑屏问题的分析与处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

22年6月实施了1套VMware vsan+horizon2206+a6000显卡 vGPU桌面搭建,将实施过程中遇到的问题记录一下。

1,服务器BIOS的设置(vGPU场景)

2,云桌面中使用LUMION基准测试评分低,解除FRL限制

3,云桌面黑屏问题分析处理

有问题可以联系我:19180701992

服务器使用的戴尔740xd,3台服务器做vsan集群,配置如下:

7264ca5ce3bc400f8449c15ee06a693c.png

 2个M.2安装esxi,2个SSD做缓存,10个8T做容量层,2个10GE口做业务和vmotion,2个10GE口做vsan内部数据同步。

1,戴尔服务器BIOS设置如下:

检查BIOS选项,打开VT-D,SR-IOV,Above 4G decoding(各服务器可能名称略有区别),同时由于vsphere的限制,需要把MMIO HBASE设置成小于16T的数值(戴尔服务器设置成12T)。

vsan的搭建网上文档很多,基本是下一步下一步搞到,

搭建完成后,使用HCIbench工具,测试vsan性能。

4K 70%的读,100%随机 ,IOPS15万多,带宽600M/S,延迟都低于25ms。(应该还没到峰值)

e3193e82dc54423b9c165a5952dda6e6.png

 

 2,解除FRL限制,vGPU模式默认是开启了FRL限制的,目的是平衡VM之间对GPU资源的占用,但客户在使用lumion的时候,发现评分很低,此时可以解除FRL限制

现象:

未解除FRL限制时,用Lumion基准测试很低,blast和PCOIP协议都是一样

2b35084f92e84060badae8edf23b3fec.png

显卡直通,用lumion基准测试正常

93011bd7e9934b798661eaa09c662866.png

解除FRL限制后,lumion基准测试提升

54f70dcc79cb443eb7bc9531dfa473d0.png

VMware 虚拟机解除FRL限制,在虚拟机高级设置里,编辑参数,添加

pciPassthru0.cfg.frame_rate_limiter 值 为 0   ,如果不需要时,把值改为1或者删除这个参数。

 解除FRL和未解除FRL的区别,没有解除FRL默认限制在 60FPS,解除了FRL,值为N/A

22d4b6bb969742cea024f6c52dd14dd4.png

 3,当虚拟机的内存超过32G时,可能无法初始化vGPU,桌面黑屏,蓝屏等问题。

问题描述:使用horizon客户端登陆桌面时,屏幕是黑的。点击鼠标键盘无反应。

42990246eba44a338d0e8044161a7176.png

使用MSTSC远程登陆桌面时,一直卡在请稍候界面

86fdc8613eea47edb21e4ea9d3b153e7.png

使用horizon 客户端 RDP协议登陆桌面时,NVIDIA 活动面板报:没有显示器连接到此GPU上

ded84520a2d04bbe8580a50218f28296.png

21c59e259e474e75885d2935a46caa11.png

设备管理器中--显示适配器--A6000-2Q和SVGA 3D 呈现感叹号!

32b3d79e55c747d2ad5d41545bb13daf.png

查看VMware 虚拟机日志VMware.log 或者出现黑屏时间最近的VMware-X.log

c001bb26d8cc474aaca539322abc0fd0.png

查看到vgpu 初始化报错

查看NVIDIA官网文档,发现有相似的问题描述

7fd12ee4d6644d7899e289dca94243ce.png

描述说,VM的内存大于32G时就会出现此问题,刚好我的云桌面内存就是32G

ed6e73cee0f7416c8e387f708c7fac7f.png

NVIDIA-bug-report 日志记录(SSH到主机,运行命令 NVIDIA-bug-report.sh)

6749640ac84b42989a00e6e740854487.png

559e5dc9ebd644ebbe87565473ffd9fe.png

登陆桌面 运行 msinfo32 , 点击文件--保存

2cf359cbce88418ea38d69777747c376.png

msinfo32 错误报告信息显示 有2次 nvdisplay 错误信息

解决方法:大于32G内存的VM 高级设置里添加以下参数:

pciPassthru0.cfg.enable_large_sys_mem = 1

pciPassthru0.cfg.extra_fb_reservation = 128

pciPassthru.use64bitMMIO= TRUE

pciPassthru.64bitMMIOSizeGB = 128

如果在模板上添加这4个参数,发出的桌面只有后面2个参数,前面2个参数还得一个个的添加。

a194b4af98e9463f88fb893dcc03ae30.png

同时,模板显卡--总显存改为128M,显示器数量改为2,模板操作系统更新到最新。

 

如果上面设置没解决问题,尝试换个版本的设计软件,比如使用最新版的revit,因为黑屏掉显卡的时候通常都是在使用某个软件造成的。

 

设计软件使用中感觉卡顿。比如cad,ug等画图或者拉扯模型时感觉卡。首先尝试降低分辨率试试,目前常用的1080p分辨率使用这些软件正常。如果换成2k或者更高的分辨率就会卡顿。

 

VMware Horizon是一种虚拟桌面基础架构(VDI)解决方案,它提供了一个集中管理的桌面环境,可以让用户随时随地,从任何设备上登录到公司的虚拟桌面中。 VMware Horizon支持从多种客户端设备(包括计算机、智能手机和平板电脑)访问虚拟桌面,让用户得到了更大的移动工作灵活性。 为了搭建VMware Horizon环境,需要一个VMware vSphere平台运行VMware Horizon组件。这些组件包括Horizon Connection Server、View Composer、Horizon Security Server和Horizon View Agent。另外,需要安装ESXi主机,并为虚拟桌面分配资源(例如vCPU、内存、磁盘空间等)以及配置存储管理方案。同时也需要给投影仪设置一个组策略,以提高用户体验。 在制定VMware Horizon部署策略时,需要考虑以下几个因素:虚拟桌面的大小、虚拟机数量和存储需求,以及登陆用户数和网络峰值。如何改善用户体验也是一个需要考虑的问题,主要有向投影仪添加额外的vCPU和内存。此外,还可以通过电脑组策略限制用户的存储空间使用,以保持整个系统的稳定性。 总的来说,VMware Horizon提供了一种高效、安全、灵活的桌面虚拟化技术,它可以带来更高的生产效率和更好的用户体验。在搭建VMware Horizon环境时,需要考虑一些重要的因素,如系统资源、存储性能、用户需求和安全问题等。如果能够综合考虑这些因素,并给予适当的解决方案,将大大提高VMware Horizon的可靠性和效率,从而实现更好的业务成果。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我热烈的温

经验分享,很有价值

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值