第六代GPU:光线追踪与网格着色器技术解析
在计算机图形技术的发展历程中,GPU的每一次重大革新都为行业带来了质的飞跃。本文将深入探讨第六代GPU所涉及的光线追踪和网格着色器等前沿技术。
1. 技术发展背景
- DirectX 12的诞生 :2014年3月,微软在旧金山的游戏开发者大会(GDC)上宣布了DirectX 12,并于2015年7月29日随Windows 10正式推出。其主要亮点是为Direct3D 12引入了先进的低级编程API,有效降低了驱动程序开销。
- 光线追踪技术的突破 :长期以来,光线追踪技术一直被认为是实现逼真图形渲染的关键,但由于其计算量巨大,实时渲染一直难以实现。2018年,英伟达凭借其图灵GPU实现了这一突破,带来了实时光线追踪技术。光线追踪通过追踪光线的路径,可以模拟反射、折射、软阴影等多种光学效果,在几何和光照方面具有物理正确性。
2. 2018 - 2020年的技术进展
- 英伟达的创新举措 :2018年,英伟达一次性引入了三项新技术,分别是光线追踪、可变速率着色和网格着色器。其中,网格着色器可能是最具影响力的一项。同年8月,在SIGGRAPH 2018大会上,英伟达展示了图灵GPU并演示了实时光线追踪。当时,应用开发者需要使用英伟达未经授权的DirectX 12扩展来实现这一功能。
- 微软的跟进 :2018年10月,微软宣布将DirectX光线追踪(DXR)从实验模式中推出。用户和开发者更新到下一版本的Windows 10后,在支持的硬件上即可使用完全可用的DirectX光线追踪功能。2019年11月,微软宣布将发布DirectX 12 Ultimate,其中包括网格着色器功能、可变速率着色(VRS)、更新的光线追踪级别(至1.1版)和采样器反馈等。
3. 网格着色器的特点与优势
- 新型着色器的诞生 :网格着色器是一种新型着色器,它将顶点和图元处理相结合。它用放大着色器和网格着色器取代了顶点着色器(VS)、外壳着色器(HS)、域着色器(DS)和几何着色器(GS)阶段。大致来说,网格着色器取代了VS + GS或DS + GS着色器,而放大着色器取代了VS + HS。
- 提高GPU计算能力 :放大着色器允许程序员决定运行多少个网格着色器组,并将数据传递给这些组。最终,它取代了硬件细分曲面,使GPU成为一个计算引擎。
4. 市场动态与发展瓶颈
- GPU市场放缓 :2018年,新GPU和AIB(显卡)的推出速度放缓,但AIB的销售并未受到影响。AMD和英伟达放缓的原因是设计、开发和发布的成本越来越高。
- 加密货币热潮的影响 :加密货币热潮让两家公司措手不及。尽管AMD的AIB在效率和价格上更具优势,但英伟达凭借品牌影响力在加密货币市场销售更多。两家公司都因市场需求而出现库存短缺的情况。
5. 英伟达图灵GPU的卓越性能
- 强大的硬件规格 :图灵架构是首个实现实时光线追踪的消费级产品架构,包含人工智能处理器(张量核心)和专用光线追踪处理器。英伟达的图灵GPU采用台积电的12nm FinFET工艺制造,顶级的TU102 GPU拥有186亿个晶体管、4608个着色器、288个纹理映射单元(TMUs)、96个光栅操作单元(ROPS)和72个流式多处理器(SMs),其面积达754平方毫米,可产生14.2 TFLOPS的计算能力。
-
独特的技术特性
:
- 张量核心的应用 :张量核心用于深度学习(DL)和AI推理,如DL抗锯齿(DLAA)、视频和图像去噪、分辨率缩放以及视频重定时等。该GPU每秒能够执行多达500万亿次(张量)操作(TOPS),几乎是帕斯卡GPU的十倍。
- 光线追踪能力 :图灵GPU每秒可生成多达100亿条光线,其光线追踪处理能力相当于渲染农场中数十个高端CPU的总和。
- 深度学习抗锯齿(DLAA) :图灵GPU拥有深度学习抗锯齿(DLAA)和时间卷积自动编码器。它可以以低分辨率渲染以节省资源,然后使用AI将图像放大输出到屏幕上。英伟达通过向算法输入同一帧的64个抖动样本创建一个真实帧,来训练其DLAA算法确定图像的真实属性。
- 深度学习超级采样(DLSS) :由于张量核心在光线追踪图像去噪时利用率不高,英伟达开发了DLSS技术。DLSS使用特定于游戏的AI算法从低分辨率图像生成高分辨率图像,在不降低图像质量的情况下提高了性能。
6. 光线追踪技术的深入解析
- 实时光线追踪的实现 :图灵架构使实时光线追踪成为现实,它结合了人工智能处理器、专用光线追踪处理器和大量通用着色器,大大提高了光线追踪的速度。
- DirectX光线追踪的发展 :2018年10月,微软发布支持DirectX光线追踪(DXR 1.0)的Windows 10操作系统和软件开发工具包(SDK)。游戏开发者开始在官方版本中使用DXR,并推出了多款具有光线追踪功能的游戏。2019年11月发布的DXR 1.1版本提供了更多功能,如允许向现有光线追踪管线状态对象(PSO)添加额外着色器,增加了动态PSO添加的效率;引入了Execute Indirect功能,使自适应算法能够在GPU执行时间线上决定光线数量;还添加了内联光线追踪功能,允许更直接地控制光线遍历算法和着色器调度。
- AI在光线追踪中的应用 :英伟达利用图灵GPU中的张量处理器对光线追踪图像进行AI去噪,通过减少获取清晰图像所需的光线数量来加速光线追踪。同时,为了充分利用张量核心,英伟达开发了DLSS技术,该技术通过将低分辨率图像提升为高分辨率图像,在提高性能的同时保持了图像质量。
7. 混合渲染技术
- 技术原理 :英伟达在图灵架构中引入了一种新的AI增强渲染技术——混合渲染。该技术结合了光线追踪核心的图像去噪和图像缩放功能,利用GPU的张量核心和RT核心,在Epic的实时光线追踪(RTRT)和微软的DXRT光线追踪API中,将光线追踪性能提高了约六倍。
- 优势体现 :RT核心加速了边界体积层次结构(BVH)遍历和光线/三角形相交测试,使着色器核心能够处理场景的其他方面。这种技术将基于计算机的光栅化和基于计算的技术与硬件加速和深度学习相结合,实现了更快的实时光线追踪,并已被一些游戏和引擎采用。
8. 可变速率着色技术
- 技术背景 :由于不同代和不同级别的GPU性能存在差异,一些GPU无法在输出图像的每个部分都保持一致的质量。可变速率着色(VRS)技术应运而生,它源于注视点渲染和运动自适应着色等技术的发展。
- 具体实现方式 :图灵GPU的可变速率着色允许开发者为不同的帧区域(图像)设置不同的着色速率。对于每个16×16像素区域,开发者有七种选项,还可以使用着色结果为4个像素(2×2)、16个像素(4×4)或非方形区域(如1×2或2×4)着色。开发者可以通过纹理在空间上指定着色速率,使得单个三角形可以使用多种着色速率,实现了精细的控制。
- 优势对比 :VRS允许开发者在不改变可见性速率的情况下控制着色速率,这使得它比多分辨率着色(MRS)和镜头匹配着色(LMS)等技术更有用。同时,VRS、MRS和LMS可以结合使用,因为它们是由不同硬件路径支持的独立技术。
9. DLSS 2.0技术
- 技术概述 :DLSS(深度学习超级采样)是一种用于光线追踪的时间图像缩放技术。2020年3月,英伟达发布了DLSS 2.0版本,与1.0版本相比有了很大改进。
-
工作流程
:
- 设置参考分辨率 :英伟达将1080p作为基础分辨率,运行游戏并进行完全光线追踪。
- 数据输入与处理 :将光线追踪后的图像输入到专门设计的卷积自动编码器神经网络中,同时将从游戏引擎获得的运动向量也输入该网络。
- 图像生成与优化 :网络对关键元素进行分割、重组,生成4K输出文件。该文件与16K参考文件的样本文件一起通过网络进行多次迭代,消除光线追踪过程中产生的图像噪声,最终得到高质量的光线追踪帧。
- 技术优势 :DLSS通过使用四个输入(游戏引擎的基础分辨率图像、运动向量、上一帧的高分辨率输出和大量16K分辨率的地面真值图像)来实现高质量的图像输出。它利用运动向量提供的信息进行时间反馈,减少闪烁、弹出和闪烁等伪影,同时通过对大量16K分辨率图像的训练,能够更好地处理新的内容类别,并且可以在运行密集3D游戏的同时实时运行。
10. 技术总结与展望
第六代GPU所带来的光线追踪和网格着色器等技术,为计算机图形领域带来了巨大的变革。光线追踪技术实现了实时渲染逼真图形的梦想,而网格着色器则提高了GPU的计算效率。可变速率着色和DLSS等技术进一步优化了渲染性能和图像质量。随着技术的不断发展,我们有理由相信,未来的计算机图形将呈现出更加逼真、细腻的视觉效果,为游戏、影视、虚拟现实等领域带来更多的可能性。
| 技术名称 | 主要功能 | 优势 |
|---|---|---|
| 光线追踪 | 模拟多种光学效果,实现逼真图形渲染 | 在几何和光照方面具有物理正确性 |
| 网格着色器 | 结合顶点和图元处理,提高GPU计算能力 | 取代传统着色器阶段,使GPU成为计算引擎 |
| 可变速率着色 | 为不同帧区域设置不同着色速率 | 提高渲染速度和质量,实现精细控制 |
| DLSS 2.0 | 利用深度学习对低分辨率图像进行超采样 | 提高性能的同时保持图像质量,处理新内容类别能力强 |
graph LR
A[游戏引擎] --> B[1080p基础分辨率图像]
A --> C[运动向量]
D[上一帧4K高分辨率输出] --> E[卷积自动编码器神经网络]
B --> E
C --> E
F[大量16K分辨率地面真值图像] --> E
E --> G[生成4K输出文件]
G --> H[多次迭代优化]
H --> I[最终高质量光线追踪帧]
这些技术的发展不仅推动了计算机图形行业的进步,也为相关领域的创新提供了有力支持。未来,我们期待这些技术在更多场景中得到应用,为用户带来更加震撼的视觉体验。
第六代GPU:光线追踪与网格着色器技术解析
11. 网格着色器的应用与影响
- 简化图形管线 :传统的图形管线涉及多个着色器阶段,如顶点着色器、外壳着色器、域着色器和几何着色器等,这些阶段的处理相对复杂。而网格着色器将顶点和图元处理相结合,用放大着色器和网格着色器取代了多个传统着色器阶段。例如,在处理复杂的三维模型时,传统管线可能需要多个步骤来完成顶点和图元的处理,而网格着色器可以更高效地完成相同的任务,减少了管线的复杂度。
- 提高并行计算能力 :网格着色器使用线程协作的方式在GPU内生成紧凑的网格(网格块)。这种并行计算的方式使得GPU能够更高效地处理大量的图形数据。例如,在渲染大型场景时,多个线程可以同时处理不同的网格块,大大提高了渲染速度。
- 推动图形编程模型的发展 :网格着色器将计算编程模型引入到图形管线中,为开发者提供了更灵活的编程方式。开发者可以利用线程协作和并行计算的优势,实现更复杂的图形算法和效果。
12. 光线追踪技术对行业的变革
- 游戏行业 :光线追踪技术为游戏带来了更加逼真的光照和阴影效果。在以往的游戏中,光照和阴影的模拟往往不够真实,而光线追踪可以精确地模拟光线的反射、折射和散射等现象,使游戏场景更加生动。例如,在一些支持光线追踪的游戏中,玩家可以看到光线在水面上的反射、物体的阴影随着光线的变化而变化等效果,大大提升了游戏的沉浸感。
- 影视制作行业 :在影视制作中,光线追踪技术可以提高渲染质量和效率。传统的渲染方法在处理复杂的光照效果时往往需要大量的计算资源和时间,而光线追踪可以更快速地生成高质量的渲染图像。例如,在制作动画电影时,光线追踪可以帮助制作团队更轻松地实现逼真的光影效果,减少渲染时间和成本。
- 虚拟现实(VR)和增强现实(AR)行业 :光线追踪技术可以为VR和AR应用提供更加真实的视觉体验。在VR环境中,逼真的光照和阴影效果可以增强用户的沉浸感;在AR应用中,光线追踪可以使虚拟物体更好地融入现实场景中。例如,在VR游戏中,光线追踪可以让玩家感受到更加真实的环境光照,提高游戏的真实感。
13. 技术发展的挑战与机遇
- 计算资源需求 :光线追踪和网格着色器等技术对计算资源的需求较高。这些技术需要大量的GPU计算能力和内存带宽来实现实时渲染。为了满足这些需求,硬件厂商需要不断提高GPU的性能和内存带宽。例如,英伟达通过不断优化GPU架构和采用更高性能的内存技术,来提高GPU的光线追踪和计算能力。
- 软件适配问题 :新的图形技术需要软件开发者进行适配和优化。游戏开发者需要学习和掌握新的编程接口和算法,以充分发挥光线追踪和网格着色器等技术的优势。同时,游戏引擎也需要进行相应的更新和优化,以支持这些新技术。例如,一些游戏引擎已经开始支持DirectX光线追踪和网格着色器等功能,为开发者提供了更好的开发环境。
- 市场竞争与合作 :在GPU市场中,英伟达和AMD等厂商之间存在着激烈的竞争。为了争夺市场份额,厂商们需要不断推出创新的产品和技术。同时,厂商之间也存在着合作的机会,例如在标准制定和技术推广方面。例如,Khronos宣布将英伟达的网格着色器代码作为Vulkan和OpenGL的扩展,促进了技术的推广和应用。
14. 未来技术发展趋势
- 更高的性能和效率 :未来的GPU将继续提高光线追踪和计算能力,以实现更加逼真和高效的图形渲染。例如,硬件厂商可能会采用更先进的制程工艺和架构设计,提高GPU的性能和能效比。
- 更广泛的应用场景 :光线追踪和网格着色器等技术将不仅仅应用于游戏和影视制作领域,还将在科学研究、工业设计、教育等领域得到更广泛的应用。例如,在科学研究中,光线追踪技术可以用于模拟物理现象和实验结果;在工业设计中,网格着色器可以提高产品设计的效率和质量。
- 与其他技术的融合 :光线追踪和网格着色器等技术将与人工智能、机器学习等技术进行更深入的融合。例如,人工智能可以用于优化光线追踪算法和图像去噪,提高渲染质量和效率;机器学习可以用于生成更加逼真的图形模型和纹理。
| 挑战 | 应对措施 |
|---|---|
| 计算资源需求高 | 硬件厂商提高GPU性能和内存带宽,采用先进制程工艺和架构设计 |
| 软件适配问题 | 软件开发者学习新编程接口和算法,游戏引擎进行更新优化 |
| 市场竞争 | 厂商推出创新产品和技术,加强标准制定和技术推广合作 |
graph LR
A[当前技术] --> B[更高性能和效率]
A --> C[更广泛应用场景]
A --> D[与其他技术融合]
B --> E[未来GPU发展]
C --> E
D --> E
第六代GPU的光线追踪和网格着色器等技术为计算机图形领域带来了革命性的变化。这些技术不仅提高了图形渲染的质量和效率,还为游戏、影视、虚拟现实等行业带来了更多的可能性。虽然目前技术发展面临着一些挑战,但随着硬件和软件的不断进步,我们有理由相信,未来的计算机图形将呈现出更加绚丽多彩的景象,为用户带来前所未有的视觉体验。
超级会员免费看
364

被折叠的 条评论
为什么被折叠?



