GPU 拾取的多重奇幻之旅：颜色编码、G-Buffer 与光线追踪的全景探索-优快云博客

本文链接：https://blog.youkuaiyun.com/xiaohujx/article/details/146074829

原文链接 (原文阅读体验更好一些)

在三维图形世界中，如何让计算机迅速知道“你点中了哪一个对象”？这就好比魔法师凭借神秘符咒辨识每一个独特角色的身份。GPU 拾取便是这门魔法的核心，它利用 GPU 的并行计算能力，从海量数据中快速找出用户点击的目标。而实现这一过程的方法也多种多样：从传统的颜色编码到借助 G-Buffer，再到现代的光线追踪与 Compute Shader 技术。下面，让我们一起走进这个多重奇幻的世界，看看各种 GPU 拾取技术是如何施展魔法的。

一、GPU 拾取的魔法简介

在交互式三维应用中，每当用户在屏幕上点击或触摸时，系统需要判断这点对应的是哪一个对象。这一过程若完全依赖 CPU 进行几何计算，不仅复杂且效率低下。GPU 拾取的思路正是利用 GPU 的高速并行运算，通过离屏渲染生成一张“秘密地图”，并在地图中标记出每个对象的唯一身份标识（Pick ID）。用户点击后，只需从这张地图中读取特定像素的信息，即可还原出被点击对象的身份。

下面列出几个目前GPU拾取的技术方案:

二、颜色编码拾取：魔法相机与神奇画布

2.1 离屏渲染与 Framebuffer 的魔法

想象你手中有一台魔法相机，它并不直接拍摄你看到的彩色世界，而是在一块隐秘的画布——Framebuffer 上作画。在这块画布上，每个对象都用独一无二的颜色“签名”自己。具体过程是：

创建 Framebuffer
：建立一个专用的离屏缓冲区，附加颜色纹理（以及必要的深度或模板缓冲）。
设置渲染状态
：关闭所有可能影响颜色输出的光照、阴影、混合等效果，确保输出的颜色纯粹对应对象的 Pick ID。
绘制对象与颜色编码
：将每个对象的 ID 拆分成 RGB 分量，写入 Framebuffer 中的像素颜色。

2.2 读取与解码：破解颜色密码

当用户点击屏幕时，魔法相机便会从离屏画布中读取点击点的颜色。然后，通过简单的数学运算，将颜色值还原成对象 ID，就好像解开了一串神秘密码。颜色编码拾取既直观又高效，是目前最常见的 GPU 拾取技术之一。

三、G-Buffer 拾取：延迟渲染中的隐秘线索

3.1 G-Buffer 的概念

在延迟渲染（Deferred Rendering）管线中，场景的各种属性（如法线、深度、材质信息）被分别存储在多个缓冲区中，统称为 G-Buffer。如果我们在其中增加一个专门存储对象 ID 的通道，那么拾取过程就可以直接利用已有的 G-Buffer 数据。

3.2 G-Buffer 拾取的流程

提前存储对象信息
：在主渲染过程中，除了输出颜色外，还将每个像素对应的对象 ID 写入 G-Buffer 的专用通道中。
读取 G-Buffer
：用户点击后，从 G-Buffer 中读取对应像素的对象 ID，而无需额外的离屏渲染。

这种方法能在延迟渲染场景中节省额外的渲染开销，但也要求系统具备构建和管理 G-Buffer 的能力。它适用于对光照、后处理效果要求较高的应用场景。

四、深度缓冲拾取：探寻深度中的真相

4.1 利用深度信息的思路

另一种常见的 GPU 拾取方式是利用深度缓冲（Z-Buffer）。在渲染过程中，每个像素不仅有颜色信息，还有深度信息。通过读取深度值，可以反推出点击点在 3D 空间中的位置，从而结合场景中对象的空间分布进行进一步判定。

4.2 工作原理

获取深度值
：当用户点击时，从深度缓冲中读取该像素的深度值。
反算世界坐标
：利用逆投影矩阵，将深度值转换成世界空间坐标。
空间检测
：根据已知的场景数据，判断哪一个对象最有可能在该位置上。

深度缓冲拾取无需额外的颜色编码过程，但往往需要结合 CPU 端的精细计算来确定具体的对象边界。

五、Compute Shader 与光线追踪拾取：未来的魔法

5.1 Compute Shader 拾取

利用 Compute Shader 技术，可以在 GPU 上直接并行计算射线与场景中对象的碰撞检测。这种方式不依赖离屏渲染，而是直接执行一段程序，利用 GPU 的大规模并行处理能力进行精确的碰撞检测。它适合高精度需求场景，但实现起来对开发者要求较高。

5.2 光线追踪拾取

光线追踪技术（Ray Tracing）通过在 GPU 上构建加速结构（如 BVH）来实现高效的射线求交。当用户点击时，生成一条从摄像机出发的射线，由硬件加速器快速遍历场景，加速求交。虽然光线追踪能提供极高精度，但目前主要依赖高端 GPU 和专用 API（如 DXR 或 Vulkan RT），在普遍的应用中尚未普及。

六、对比

拾取方法	优势	局限性	适用场景
颜色编码拾取	- 实现简单、直观 - 性能高（通过局部离屏渲染降低开销） - 跨平台适用（低硬件要求）	- 编码空间有限（24 位可能不够） - 多重采样可能导致颜色插值问题	- 实时交互、WebGL 应用 - 面向低端设备与跨平台场景
G-Buffer 拾取	- 利用延迟渲染已有的多通道数据 - 无需额外的离屏渲染 - 可同时获取丰富信息（如法线、深度）	- 仅适用于延迟渲染系统 - 实现复杂度高 - 对硬件资源依赖较高	- 高端图形应用和游戏 - 已构建延迟渲染管线的系统
深度缓冲拾取	- 利用现成的深度数据 - 实现较直观 - 能获取点击点在空间中的大致位置	- 深度精度有限，难以精确区分重叠对象 - 通常需要结合 CPU 辅助搜索	- 地形点击定位 - 粗略碰撞检测或对精度要求不高的场景
Compute Shader / 光线追踪拾取	- 精度极高，可精确计算射线与物体交点 - 灵活性强，适用于复杂交互需求	- 实现复杂、开发难度大 - 硬件依赖性高（需要高端 GPU 和专用 API） - 性能开销较大，尤其在大场景下加速结构更新成本高	- 原生应用或高端引擎 - 对精度要求极高且硬件条件充足的场景