28、第六代GPU：光线追踪与网格着色器

最新推荐文章于 2025-09-14 16:16:17 发布

咖啡JSON

最新推荐文章于 2025-09-14 16:16:17 发布

阅读量50

点赞数

CC 4.0 BY-SA版权

分类专栏： GPU进化史：从游戏到AI 文章标签： GPU 英伟达图灵GPU 英特尔Xe GPU

本文链接：https://blog.youkuaiyun.com/i1j2k/article/details/151666154

GPU进化史：从游戏到AI 专栏收录该内容

30 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

第六代GPU：光线追踪与网格着色器

1. 英伟达图灵GPU的突破

英伟达展示了GPU能够不断进化，以实现照片级真实感和交互式帧率的梦想。为GPU添加额外的专用处理器或引擎并非新概念，早期的图形控制器就具备视频编解码器、音频和独特功能加速器。图灵GPU在不断扩展的GPU功能中加入了AI和专用光线追踪核心。图灵处理器是一款革命性产品，为其他GPU供应商设定了必须达到的门槛。

英伟达图灵GPU是一款突破性设备，它拥有最多的着色器，是当时制造的最大芯片。它面向两个市场设计，即游戏和数据中心，但这也导致其包含了一些每个细分市场并非都需要的部件。这虽然让英伟达获得了规模经济的优势，但也抬高了价格。不过，这款GPU对英伟达来说非常成功。

2. 英特尔Xe GPU的发展历程

项目启动 ：2017年，英特尔启动了代号为Xe的GPU项目。同年11月，英特尔聘请了AMD的Radeon技术集团负责人Raja Koduri，2018年又聘请了其他几位AMD人员，并非正式宣布可能在2019年的CES上推出离散GPU。
技术展示与计划公布 ：
- 2018年2月，英特尔在IEEE国际固态电路会议上展示了一款基于14纳米三栅极CMOS的节能图形处理器原型，该芯片有15亿个晶体管，频率范围从0.51V下的50MHz到1.2V下的400MHz。
- 2018年6月，英特尔确认计划在2020年推出代号为Arctic Sound的离散GPU，该芯片将涵盖从数据中心到入门级PC游戏应用。
- 2018年12月的英特尔架构日，Koduri宣布新的Xe GPU架构将从集成扩展到GPU计算，首款移动版将于2019年推出。
- 2019年5月，英特尔宣布高端可视化系统将使用Xe并支持光线追踪。同年，英特尔表示将在2021年推出采用7纳米制造的Xe GPU，首款通用版将基于10纳米工艺。
- 2019年10月，英特尔测试了首款代号为DG1的离散GPU，并在10月底宣布了首款离散GPU产品英特尔iRISXe Max。
产品推出与特性 ：
- 2020年，英特尔推出了搭载Xe集成GPU的第11代CPU（代号Tiger Lake）。
- 2021年11月，英特尔推出了第12代CPU Adler Lake，其集成GPU可驱动多达五个显示输出，具备多种编码/解码功能。
- Gen12 Xe LP媒体引擎在Tiger Lake中相同，但迁移到英特尔的7纳米工艺，有GT1（32个执行单元，用于桌面）和GT2（96个执行单元，用于笔记本）两个版本。英特尔称Xe LP引擎支持1080p游戏，拥有端到端的12位视频管道，桌面模型没有图像处理单元，该功能仅在移动设备上可用。

3. 英特尔Xe Max（2020）

产品发布与背景 ：英特尔在PC图形芯片领域有着悠久历史，但此前在打造离散图形芯片以挑战市场领导者方面一直面临困难。2020年底，英特尔宣布推出新的离散GPU Xe Max。
产品特性与优势 ：
- 英特尔将iRISXe Max与第11代英特尔酷睿移动处理器配对，声称该新dGPU提供附加AI功能，即新dGPU和CPU的iGPU可协同进行推理和渲染，能将内容创作工作负载加速多达七倍。
- 与第10代英特尔酷睿i7 - 1065G7搭配英伟达GeForce MX350相比，2020年的dGPU提供的Hyper Encode编码速度比高端桌面图形AIB快达1.78倍。
- iRISXe Max与英特尔的Deep Link配合使用，可实现动态功率共享，当离散图形闲置时，CPU可获得全部功率和热资源，英特尔称这可使CPU性能提高多达20%。
技术规格 ：
| 技术规格 | 详情 |
| ---- | ---- |
| 产品名称 | 英特尔iRISXe max graphics |
| 执行单元（EUs） | 96 |
| 频率 | 1.65 GHz |
| 光刻工艺 | 10 nm SuperFin |
| 图形内存类型 | LPDDR4x |
| 图形容量 | 4 GB LPX DDR4 |
| 图形内存总线宽度 | 128 |
| 图形内存带宽 | 68 GB/s |
| PCI Express | Gena |
| AI支持 | Intel DLBoost: DP4A * |
| 媒体 | 2个多格式编解码器（MFC）引擎 |
| 英特尔深度链接技术 | 是 |
| 支持的显示器数量 | eDP 1.4b, DP 1.4, HDMI 2.0b |
| 图形输出 | 4096 × 2304 at 60 Hz (HDM1/eDP) |
| 最大分辨率 | 7680 × 4320 at 60 Hz DP |
| 像素深度 | 12 - bit HDR |
| 图形特性 | 可变速率着色、自适应同步、异步计算 |
| DirectX支持 | (Beta) |
| OpenGL支持 | 12.1 |
| OpenCL支持 | 4.6 |
| 功率 | 25 W |

4. 英特尔GPU的技术挑战与解决方案

缩放问题 ：英特尔此前在图形领域，特别是离散图形部件方面，缩放一直是个问题。此前推向市场的产品性能一般，缺乏扩展空间。不过，英特尔的最后三代集成GPU在缩放和工艺利用方面表现出色。英特尔计划提供从入门级（如iRISXe Max）到超级计算机加速器（如Porte Vecchio）的Xe dGPU，但实际实现难度很大，不同产品段在缓存、内存控制器、总线管理器等方面差异很大。
技术创新 ：
- 嵌入式多芯片互连桥（EMIB） ：自Larrabee项目以来，英特尔开发了EMIB技术。此前设计师会将异构芯片放在单个封装中，使用带有硅通孔的中介层进行通信，即2.5D封装。EMIB则采用嵌入基板层的微小硅桥替代中介层，硅桥包含微凸点以实现芯片间连接。英特尔的Kaby Lake是首批采用嵌入式桥的产品之一，它展示了EMIB可用于封装异构芯片，能整合宝贵的电路板空间，提高性能并降低成本。
- Foveros技术 ：2018年底，英特尔推出了3D堆叠方法Foveros技术。Lakeﬁeld处理器是该技术的首次应用，它使用10纳米芯片集成处理核心、内存控制和图形，该芯片置于包含平台控制器中心功能（如音频、存储、PCIe）的14纳米低功耗基础芯片之上，通过微凸点和硅通孔实现电源和通信连接，顶部还放置了合作伙伴的LPDDR4X内存。

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(英特尔Xe GPU项目启动):::process --> B(技术展示与计划公布):::process
    B --> C(产品推出与特性):::process
    C --> D(英特尔Xe Max发布):::process
    D --> E(技术挑战与解决方案):::process

英特尔在GPU领域不断探索和发展，虽然面临诸多挑战，但通过技术创新和产品规划，有望在市场中占据一席之地。后续英特尔还将推出更多基于Xe架构的产品，值得关注其在图形处理性能、功能特性等方面的进一步表现。

第六代GPU：光线追踪与网格着色器

5. 英特尔dGPU家族（2021）

管理层变动与扩张 ：2016 - 2021年，英特尔在其Hillsboro研究和制造中心遭遇了一系列制造失败，导致三代新处理器延迟推出。与此同时，AMD推出了一系列强大的x86 CPU，抢占了英特尔的市场份额和利润。2021年1月，英特尔聘请了前CTO Pat Gelsinger回归。Gelsinger回归后，英特尔为2022年计划的30亿美元Hillsboro工厂扩建招聘了数百名员工，并在Folsom加利福尼亚州的设施扩大了就业，这里是中央dGPU Xe团队的所在地。
DG1与产品命名变更 ：
- 2020年1月的CES上，英特尔展示了基于Xe的DG1离散图形AIB。它是将下一代集成GPU从CPU中分离出来制成的离散部件，使用传统DDR RAM，性能与iGPU相差不大，但确立了DG产品名称，开发者可使用它运行测试代码。
- 2021年6月，英特尔首席架构师Raja Koduri在推特上发布了DG2芯片的图片。2021年8月的重新举办的架构日虚拟会议上，英特尔宣布了产品范围和新的命名规则。
Arc客户端图形路线图 ：
- 命名变更 ：英特尔停用了DG#命名，将其重命名为Arc，并添加了代际子集，如Alchemist（此前称为DG2）、Battlemage、Celestial和Druid。
- Xe - HPG架构 ：Koduri表示为Xe家族添加了第四种微架构Xe - HPG，专为游戏优化，具备包括光线追踪支持在内的许多新图形功能，预计2021年发货。该架构采用了Xe - LP架构的节能处理块和为数据中心及超级计算机的Xe - HP/Xe - HPC GPU开发的高频优化，拥有高带宽内部互连、GDDR6供电的内存子系统和硬件加速光线追踪支持。英特尔大胆地选择在台积电制造DG2系列GPU。
- 产品上市 ：Xe - HPG微架构为Alchemist系列SoC提供动力，首批相关产品于2022年第一季度以英特尔Arc品牌上市。

6. 英特尔Arc Alchemist系列GPU

架构特点 ：
- Xe核心包含16个向量引擎（原称为执行单元），每个向量引擎在256位SIMD内核和数据上运行，可同时处理8个FP32指令。
- 2021年10月下旬的InnovatiON活动中，英特尔确认Arc Alchemist GPU有32个Xe核心，每个Xe核心有16个向量引擎和16个矩阵引擎，相当于512个执行单元或4096个着色器核心。芯片由台积电在其台湾的N6（改进的N7）工厂制造。
产品型号与规格 ：英特尔宣布了Arc Alchemist系列的两款芯片，预计还会有一款使用较大芯片筛选部分的产品。以下是2022年3月宣布的英特尔Arc Alchemist移动型号规格：
| 技术规格 | 详情 |
| ---- | ---- |
| 核心数量 | 32个Xe核心 |
| 执行单元（EUs） | 512 |
| 着色器核心 | 4096 |
| 制造工艺 | TSMC N6 |
| 内存类型 | GDDR6 |
| 光线追踪支持 | 有 |
| AI加速 | Xe Matrix eXtensions (XMX) |

7. 英特尔的超采样技术（XeSS）

技术原理 ：英特尔对其Xe - 超采样（XeSS）技术充满信心，预计它能在合理的渲染速率下达到质量和性能的最佳平衡点。XeSS类似于AMD的FSR和英伟达的DLSS，它从低分辨率HD图像开始，使用AI确定中间帧并将其放大到4K。
开发支持 ：2021年的会议上，英特尔表示将为开发者提供代码和工具的SDK。XeSS利用Alchemist的XMX AI加速进行放大，XMX AI使用深度学习合成接近原生高分辨率渲染质量的图像。
应用效果 ：使用XeSS，原本只能在较低质量设置或分辨率下运行的游戏可以在更高质量设置和分辨率下流畅运行。XeSS通过重建相邻像素的子像素细节和运动补偿的前一帧来工作，由经过训练以实现高性能和卓越质量的神经网络执行重建，性能可提高多达两倍。英特尔称XeSS可在包括集成图形在内的广泛硬件上工作，依赖DP4a指令集。多个游戏开发者已采用XeSS，2021年11月ISV可获得初始XMX版本的SDK，DP4a版本稍后推出。

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(英特尔dGPU家族发展):::process --> B(DG1展示):::process
    B --> C(命名变更为Arc):::process
    C --> D(Arc Alchemist系列推出):::process
    D --> E(英特尔XeSS技术应用):::process

英特尔在GPU市场的发展历程充满挑战与机遇。从早期在图形领域的不断尝试，到如今推出一系列基于Xe架构的产品，英特尔通过技术创新和战略调整，逐渐在离散GPU市场中崭露头角。随着Arc系列GPU的推出和XeSS等技术的应用，英特尔有望在游戏、数据中心等领域与英伟达、AMD等竞争对手展开更激烈的竞争，为用户带来更多高性能、创新功能的图形处理解决方案。未来，我们可以期待英特尔在GPU技术上的进一步突破和发展。