实时全局光照技术突破（SSAO、RTX、Light Propagation详解）

原创于 2025-12-06 10:00:23 发布 · 148 阅读

CC 4.0 BY-SA版权

第一章：实时全局光照技术概述

实时全局光照（Real-time Global Illumination, RTGI）是现代计算机图形学中实现高度真实感渲染的核心技术之一。它模拟光线在场景中多次反射、折射的传播过程，不仅计算直接光照，还包含间接光照的影响，从而生成更接近现实世界的视觉效果。随着GPU计算能力的飞跃和光线追踪硬件的普及，RTGI已逐步从离线渲染走向实时应用，广泛应用于游戏、虚拟现实和影视预览等领域。

技术核心原理

全局光照基于渲染方程（Rendering Equation），通过积分方式计算每个表面点接收到的全部入射光能量。实时实现通常采用近似算法以平衡性能与画质，常见方法包括：

屏幕空间反射（SSR）——利用当前帧缓冲信息估算反射
体素化全局光照（VXGI）——将场景体素化后进行光线步进
光线追踪全局光照（RTGI with Ray Tracing）——借助硬件加速光线查询

基于光线追踪的实现示例

现代API如DirectX 12和Vulkan支持实时光线追踪。以下是一个简化版HLSL着色器调用光线生成的代码结构：


// 光线生成着色器片段
[shader("raygeneration")]
void RayGenShader()
{
    RayDesc ray;
    ray.Origin = cameraPosition;
    ray.Direction = normalize(rayDir);
    ray.TMin = 0.01f;
    ray.TMax = 1000.0f;

    // 发射主光线
    TraceRay(scene, RAY_FLAG_CULL_DISABLE, 0xFF, 0, 0, 0, ray);
}

该代码定义了一条从摄像机出发的主视图光线，交由光线追踪管线处理，后续通过命中着色器（Hit Shader）累加间接光照贡献。

主流技术对比

技术	优点	缺点
SSR	性能高，易于集成	仅限屏幕内物体，视野外无反射
VXGI	支持多跳间接光	内存开销大，精度受限
硬件光线追踪	物理准确，效果最佳	依赖高端GPU，性能敏感

graph TD A[摄像机发射主光线] --> B{命中几何体?} B -->|是| C[执行命中着色器] B -->|否| D[返回背景色] C --> E[生成次级光线（反射/阴影）] E --> F[递归追踪或终止]

第二章：SSAO原理与应用实践

2.1 SSAO算法核心理论与几何遮蔽计算

屏幕空间环境光遮蔽原理

SSAO（Screen Space Ambient Occlusion）通过分析深度缓冲区与法线信息，在屏幕空间估算每个像素的环境光遮蔽因子。其核心思想是：在半球方向上采样邻近点，判断这些点是否被当前表面遮挡，从而模拟复杂光照下的阴影细节。

遮蔽因子计算流程

从当前像素的视图空间位置出发，生成随机旋转向量用于采样方向扰动
在预定义的球形核（kernel）中进行多次采样，比较采样点与原始点的深度差
根据距离阈值和法线朝向累计遮蔽值，最终进行降噪处理

// SSAO片段着色器核心逻辑
float ComputeSSAO(vec3 fragPos, vec3 normal, vec3 randomVec) {
    float occlusion = 0.0;
    vec3 tangent = normalize(randomVec - normal * dot(randomVec, normal));
    vec3 bitangent = cross(normal, tangent);
    mat3 TBN = mat3(tangent, bitangent, normal);

    for (int i = 0; i < kernelSize; ++i) {
        vec3 samplePos = TBN * samples[i]; 
        samplePos = fragPos + samplePos * radius;

        vec4 offset = vec4(samplePos, 1.0);
        offset = projectionMatrix * viewMatrix * offset; 
        offset.xy /= offset.w; offset.xy = offset.xy * 0.5 + 0.5;

        float sampleDepth = texture(depthTex, offset.xy).r;
        sampleDepth = ViewToDepth(sampleDepth);

        float rangeCheck = smoothstep(0.0, 1.0, radius / abs(fragPos.z - sampleDepth));
        occlusion += (sampleDepth <= samplePos.z ? 1.0 : 0.0) * rangeCheck;
    }
    return 1.0 - (occlusion / kernelSize);
}

上述代码中，TBN矩阵用于将采样向量变换到观察空间，radius控制采样范围，rangeCheck防止远距离误判。最终返回的遮蔽因子可直接用于光照方程中，增强场景深度感。

2.2 屏幕空间深度纹理的采样优化策略

在实时渲染中，屏幕空间深度纹理的采样效率直接影响后处理效果的性能表现。为减少带宽消耗并提升缓存命中率，采用降分辨率深度缓冲与双线性滤波结合的方式可显著优化采样过程。

优化采样核设计

通过预计算的随机旋转噪声纹理配合泊松采样分布，可在有限样本下实现高质量深度重建：


float3 ReconstructWorldPos(float2 uv, float depth, matrix invViewProj) {
    float4 clipSpace = float4(uv * 2.0 - 1.0, depth, 1.0);
    float4 viewSpace = mul(clipSpace, invViewProj);
    return viewSpace.xyz / viewSpace.w; // 透视除法还原世界坐标
}

该函数将屏幕空间 UV 与深度值反推至世界坐标，关键在于避免重复矩阵运算。建议将 invViewProj 预计算并传入着色器，减少每像素开销。

多级Mipmap辅助策略

对深度纹理构建Mipmap链，在远距离区域自动切换至低分辨率层级，有效降低内存访问压力。配合硬件各向异性采样，可进一步平滑过渡边界锯齿。

2.3 噪声纹理与采样核的配置技巧

噪声纹理的生成策略

在图形渲染中，高质量的噪声纹理（如Perlin或Simplex噪声）常用于模拟自然材质。通过GPU计算生成噪声贴图可提升实时性：


vec3 random = texture(noiseTexture, fragCoord * 0.1).rgb;
float factor = dot(random, vec3(0.333));

上述代码从预生成的噪声纹理中采样，并将其转换为灰度值用于扰动UV坐标。关键参数包括缩放因子（0.1）以控制噪声频率，避免重复感。

采样核的优化配置

采样核决定滤波质量。使用高斯核时，应根据标准差σ分配权重：

索引	偏移	权重（σ=1.0）
0	-2	0.054
1	-1	0.242
2	0	0.408

合理设置采样步长与权重分布，可在性能与图像质量间取得平衡。

2.4 基于降噪滤波的SSAO视觉增强实现

SSAO与图像噪声问题

屏幕空间环境光遮蔽（SSAO）虽能有效增强场景深度感，但原始采样结果常伴随显著噪声。尤其在低采样率下，颗粒状伪影严重影响视觉质量，需引入降噪滤波机制进行后处理优化。

高斯双边滤波的应用

采用双边滤波器在保持边缘的同时平滑遮蔽因子。其权重函数综合空间距离与法向相似性，避免跨表面错误模糊：


float ssaoBlur[5][5] = {
    {0.05, 0.1, 0.15, 0.1, 0.05},
    {0.1,  0.2, 0.3,  0.2, 0.1 },
    {0.15, 0.3, 0.45, 0.3, 0.15},
    {0.1,  0.2, 0.3,  0.2, 0.1 },
    {0.05, 0.1, 0.15, 0.1, 0.05}
};

该卷积核对SSAO纹理进行加权采样，中心权重最高，外围递减，有效抑制高频噪声。

性能与质量平衡策略

使用低分辨率渲染目标生成SSAO贴图以减少计算量
结合深度与法线缓冲区进行边缘感知滤波
多帧 temporal reprojection 可进一步提升稳定性

2.5 在Unity/Unreal引擎中集成SSAO效果

SSAO集成基础

屏幕空间环境光遮蔽（SSAO）通过分析深度和法线缓冲区，在渲染管线中实时估算物体间的遮挡关系，增强场景深度感。在Unity与Unreal中，该效果通常以后处理方式注入渲染流程。

Unity中的实现示例


[ImageEffectOpaque]
void OnRenderImage(RenderTexture src, RenderTexture dest) {
    var cam = Camera.current;
    material.SetMatrix("_InvViewProj", (cam.projectionMatrix * cam.worldToCameraMatrix).inverse);
    material.SetTexture("_DepthTex", depthTexture);
    Graphics.Blit(src, dest, material, 0);
}

上述代码将SSAO材质应用于摄像机输出。_InvViewProj用于从屏幕坐标反推世界位置，_DepthTex提供深度信息，是计算采样点可见性的关键输入。

Unreal引擎配置对比

项目	Unity	Unreal
开启方式	脚本+Shader	后处理体积
默认支持	需第三方插件	内置PostProcessSettings

第三章：RTX实时光追光照解析

3.1 光线追踪基础与硬件加速架构分析

光线追踪通过模拟光路实现真实感渲染，其核心是计算光线与场景几何的交点。传统软件实现性能受限，难以满足实时需求。

硬件加速架构演进

现代GPU集成专用光线追踪核心（如NVIDIA RT Cores、AMD Ray Accelerators），显著提升BVH遍历与求交效率。这些单元并行处理数千条光线，支持动态场景高效更新。

关键数据结构与操作

BVH（Bounding Volume Hierarchy）：加速光线-图元相交测试
包围盒求交算法：采用Slab Method判定光线与AABB相交
内存布局优化：结构体数组（SoA）提升SIMD利用率


// 简化的光线-AABB相交检测
bool intersectAABB(Ray r, vec3 min, vec3 max) {
    vec3 invDir = 1.0 / r.direction;
    vec3 tmin = (min - r.origin) * invDir;
    vec3 tmax = (max - r.origin) * invDir;
    vec3 t1 = min(tmin, tmax);
    vec3 t2 = max(tmin, tmax);
    float tNear = max(max(t1.x, t1.y), t1.z);
    float tFar  = min(min(t2.x, t2.y), t2.z);
    return tNear <= tFar && tFar > 0;
}

该函数通过反向方向向量实现高效标量计算，tNear与tFar判断光线是否穿过包围盒，是BVH遍历的基础操作。

3.2 DXR API与光追着色器管线搭建

在DirectX Raytracing（DXR）中，构建光追着色器管线是实现高效实时光线追踪的核心步骤。通过ID3D12Device5接口创建光线追踪管线状态对象（Raytracing Pipeline State, RPSO），需明确配置光线生成、命中和未命中等着色器入口点。

光追管线配置流程

定义D3D12_SHADER_BYTECODE用于加载各类型着色器
设置D3D12_RAYTRACING_SHADER_CONFIG指定射线有效载荷与属性大小
通过D3D12_RAYTRACING_PIPELINE_CONFIG设定最大递归深度

D3D12_STATE_OBJECT_DESC raytracingPipeline = {};
raytracingPipeline.Type = D3D12_STATE_OBJECT_TYPE_RAYTRACING_PIPELINE;
raytracingPipeline.pSubobjects = subobjectArray;
raytracingPipeline.NumSubobjects = arraySize;

上述代码初始化光线追踪状态对象描述符，子对象数组包含所有着色器及其配置。其中，着色器标识符必须通过导出名称匹配，确保在链接阶段正确绑定。

着色器绑定机制

着色器类型	用途
Ray Generation	启动主射线发射
Closest Hit	处理首次几何体命中
Miss	射线未击中时执行

3.3 RTX全局光照在游戏场景中的落地案例

《赛博朋克2077》中的RTX GI实现

《赛博朋克2077》是首批全面支持RTX全局光照（Global Illumination, GI）的游戏之一。通过NVIDIA的DXR API，游戏实现了动态光源在复杂城市环境中的真实反弹效果。


[shader("raygeneration")]
void RayGenShader()
{
    TraceRay(Scene, RAY_FLAG_NONE, ...);
}

上述HLSL代码片段用于启动光线追踪流程，TraceRay函数触发主视线与场景几何体的交互，结合BRDF模型计算间接光照贡献。

性能优化策略

采用降噪技术（如NVIDIA OptiX Denoiser）提升帧率稳定性
结合光栅化主通道，仅对关键区域启用RTX GI
动态调整光线采样数以平衡画质与性能

第四章：Light Propagation Volume技术深入

4.1 LPV的基本架构与球谐函数光照表示

Light Propagation Volumes（LPV）是一种用于实现实时全局光照的技术，其核心思想是将场景中的间接光照信息存储在三维网格中，并通过球谐函数（Spherical Harmonics, SH）紧凑地表示光照方向性。

球谐函数的光照编码

球谐函数通过一组正交基函数对球面上的信号进行低频逼近。常用的是二阶球谐函数，共包含4个系数：

SH₀: 表示常量分量（光照强度）
SH₁₋₃: 表示一阶方向性（X, Y, Z轴上的线性变化）

struct SphericalHarmonics {
    float sh[4]; // SH coefficients for L0 and L1 bands
};

该结构体用于存储每个网格节点的光照信息，sh[0] 对应L0带，sh[1..3] 对应L1带，可高效表达低频环境光的方向特性。

LPV的光照传播机制

通过注入阶段将表面反射光写入LPV网格，再沿网格空间传播间接光，实现多次弹射模拟。

4.2 光照传播网格的构建与更新机制

光照传播网格（Light Propagation Volumes, LPV）是一种用于实现实时全局光照的技术，其核心在于将场景空间离散化为网格结构，并在其中传播光照信息。

网格构建流程

初始化阶段，根据场景包围盒划分三维网格单元，每个单元存储球谐函数系数以表示入射光方向分布：

// 使用三阶球谐基函数存储光照
struct SHCoefficients {
    float R[9], G[9], B[9]; // 每个颜色通道9个系数
};

该结构允许紧凑表达低频光照变化，适合动态场景的近似全局照明。

更新机制

采用异步更新策略，按视点距离分级刷新网格：

近处网格：每帧更新，保证视觉精度
远处网格：隔帧或触发式更新，降低计算开销

通过GPU并行计算实现高效的传播迭代，显著提升性能。

4.3 动态光源下的LPV实时性优化方案

在动态光照场景中，LPV（Light Propagation Volumes）面临高频更新导致的性能瓶颈。为提升实时性，需从稀疏更新与数据压缩两个维度进行优化。

选择性体素更新策略

仅对受光源变动影响的体素区域执行辐射度计算，大幅降低冗余运算。该策略通过光照变化掩码（light delta mask）识别活跃体素：


// 计算光源变化引起的体素激活标志
for (int i = 0; i < volumeSize; ++i) {
    if (abs(newFlux[i] - oldFlux[i]) > updateThreshold) {
        activationMask[i] = 1; // 标记为需更新
    }
}

上述代码通过比较新旧通量差异，动态生成更新掩码，避免全局体素遍历，显著减少着色器负载。

量化存储与压缩传输

采用16位浮点数存储球谐系数，并结合Zlib压缩体素数据传输至GPU，节省带宽。实测表明，该方案在保持视觉质量的同时，将更新周期缩短约40%。

4.4 结合延迟渲染的LPV集成与性能调优

在延迟渲染架构中集成光照探针体（Light Propagation Volumes, LPV）可显著提升全局光照的真实感。通过将G-Buffer中的几何信息与LPV的光传输机制结合，可在屏幕空间之外实现高效的间接光照传播。

数据同步机制

需确保G-Buffer输出与LPV注入阶段的数据一致性。典型流程如下：


// 在G-Buffer着色器中输出法线与深度
out vec3 gNormal;
out float gDepth;

void main() {
    gNormal = normalize(worldNormal);
    gDepth = gl_FragCoord.z;
}

上述代码确保后续LPV注入阶段能正确采样表面属性，用于构建初始光照体素。

性能优化策略

降低LPV纹理分辨率以减少填充开销
使用稀疏体素更新跳过空区域
在低动态场景中启用帧间重用

通过合理配置传播步数与体素散射精度，可在视觉质量与GPU负载间取得平衡。

第五章：未来光照技术趋势与总结

智能动态光照系统在游戏引擎中的实现

现代游戏开发正逐步采用基于物理的渲染（PBR）与实时光线追踪技术。以 Unreal Engine 5 的 Lumen 系统为例，开发者可通过配置全局光照参数实现动态响应环境变化的光照效果。


// 启用Lumen全局光照
r.Lumen.Enabled 1
// 设置光线追踪反射质量
r.RayTracing.Reflections 1
r.RayTracing.Shadows 1
// 调整光照网格体分辨率
r.Lumen.SceneCaptureResolutionScale 0.5