论文阅读:4D Gaussian Splatting with Scale-aware Residual Field and Adaptive Optimization for Real-time R

4D Gaussian Splatting with Scale-aware Residual Field and Adaptive Optimization for Real-time Rendering of Temporally Complex Dynamic Scenes

Abstract

        从视频序列中重建动态场景是多媒体领域中一个很有前途的课题。虽然以前的方法已经取得了进展,但它们经常与缓慢的渲染和管理时间复杂性(如重大运动和对象出现/消失)作斗争。在本文中,我们提出了SaRO-GS作为一种新的动态场景表示,能够实现实时渲染,同时有效地处理动态场景中的时间复杂性。为了解决渲染速度慢的问题,我们采用基于高斯基元的表示,并在四维空间中优化高斯分布,从而在三维高斯飞溅的帮助下实现实时渲染。此外,为了处理时间复杂的动态场景,我们引入了尺度感知残差场。该领域在对高斯基元残差特征进行编码时考虑了每个高斯基元的大小信息,并与高斯基元的自分裂行为保持一致。在此基础上,提出了一种自适应优化方案,根据高斯基元不同的时间属性,对其分配不同的优化策略,从而加快了动态区域的重建。通过对单目和多视图数据集的评估,我们的方法已经展示了最先进的性能。请参阅我们的项目页面https://yjb6.github.io/SaROGS.github.io/

1 INTRODUCTION

        处理具有时间复杂性的动态场景。 为应对上述挑战,我们提出了SaRO - GS,旨在实现实时渲染,同时保持对具有时间复杂性的动态场景进行高质量重建。SaRO - GS由一组4D空间中的高斯基元(Gaussian primitives)和一个尺度感知残差场(Scale - aware Residual Field)组成。每个高斯基元通过自适应优化策略(Adaptive Optimization strategy)根据其独特的时间属性获得独特的优化方案。为解决渲染速度慢的问题,4D空间中的高斯基元可以基于从尺度感知残差场获得的时间属性和残差特征投影到3D空间。这样我们就能利用3DGS引入的快速可微分光栅化器(fast differentiable rasterizer)实现实时渲染。

        对于具有时间复杂性的场景进行高质量建模,我们采用以下策略:首先,每个4D高斯基元都具有时间属性,包括时间位置和生命周期。生命周期使我们能够对动态场景中物体的出现和消失进行建模,而高斯基元的时间位置跨越整个时间范围,而不是像以前的方法那样固定在第0帧。此外,我们将高斯基元的尺度信息纳入残差场,以适应椭圆体性质。通过编码高斯基元所占据的区域,而不仅仅是它们的位置,我们确保了精确的特征提取,并与高斯基元的自分裂行为保持一致。第三,我们引入了一种自适应优化策略,根据每个高斯基元的时间属性为其分配独特的优化策略,有助于更快地重建动态区域。

        我们在单目和多视角动态场景数据集上对我们的方法进行了广泛评估,这些数据集包括真实场景和合成场景。定量和定性的结果都表明,我们的方法能够实时实现高质量渲染,并有效处理动态场景中的时间复杂性。我们的贡献总结如下:

  • 我们提出了一个尺度感知残差场(Scale - aware Residual Field),将高斯函数的尺度信息纳入其中。考虑到高斯基元(Gaussian primitives)的椭圆体性质和自分裂行为,这使得时空表示更加精确。
  • 我们引入了一种自适应优化策略(Adaptive Optimization strategy),根据高斯基元独特的时间属性为其分配独特的优化方案,从而增强了动态区域的重建。
  • 我们的SaRO - GS在处理时间复杂场景方面表现出色,在重建质量和渲染速度上都达到了最先进的性能。与基于NeRF的方法相比,它的渲染速度提高了80倍,如图1所示。SaRO - GS具有通用性,适用于单目和多视角场景,并且无需先验知识就能实现动态场景分割。

3 PRELIMINARY

3.1 3D Gaussian Splatting

        给定一组静态场景的输入图像及其相应的相机参数,3D Gaussian Splitting从初始点云开始重建静态场景,采用3D高斯函数作为基元。这种方法能够实现高质量的实时新视角合成。 在3DGS中,每个高斯基元包含一组属性,包括3D位置\mu^{3d}、不透明度\alpha和协方差矩阵\Sigma。一个3D高斯\mathcal{G}可以表示为:

G(x) = e^{-\frac{1}{2}(x - \mu)^T \Sigma^{-1}(x - \mu)} \quad (1)

        为了便于优化,3DGS采用一个缩放矩阵S和一个旋转矩阵R来表示协方差,将其存储为用于缩放的3D向量s和用于旋转的四元数q

\Sigma = RS S^T R^T \quad (2)

        此外,3DGS利用球谐(SH)系数来表示与视角相关的颜色。 基于3DGS实现的快速可微分光栅化器,我们可以通过高斯散点法实现快速图像渲染。为了从给定视角获取渲染图像,我们首先应该将3D高斯基元投影到2D。具体来说,对于给定的视角变换矩阵W和投影矩阵K,我们可以得到2D空间中的协方差和位置:

$\begin{aligned} & \Sigma^{2D}=(JW\Sigma W^{T}J^{T})_{1:2,1:2} \\ & \mu^{2D}=K(\frac{W\mu}{(W\mu)_{z}})_{1:2} & \mathrm{(3)} \end{aligned}$

         其中J是投影变换的雅可比近似。并且我们可以基于公式(1)得到2D高斯\mathcal{G}^{2d}。 在根据深度将高斯基元在2D空间中排序后,我们可以得到图像中指定像素的颜色:

c(x) = \sum_{i = 1}^{N} c_i \alpha_i \mathcal{G}_i^{2d} \prod_{j = 1}^{i - 1} (1 - \alpha_j \mathcal{G}_j^{2d})(x) \quad (4)

        这里,c_i表示通过将\mathcal{G}_i的球谐系数与视角方向相结合而获得的与视角相关的颜色。

3.2 基于六面体平面的4D体表示

        之前利用平面场编码器对动态场景进行建模的工作大多采用六面体平面P,它包含空间平面P_{s o}=\{P_{x,y},P_{y,z},P_{z,x}\}和时空平面P_{s t}=\{P_{x,t},P_{y,t},P_{z,t}\}

### 使用球形高斯加速3D高斯点绘的技术细节 #### SG-Splatting 技术概述 SG-Splatting 是一种用于加速 3D 高斯点绘 (3D Gaussian Splatting) 的技术,通过引入球形高斯函数来简化计算并提高渲染效率。该方法特别适用于实时辐射场渲染场景中的复杂光照效果模拟。 #### 实现原理 为了有效处理大规模的三维数据集,在传统基础上进行了改进: - **球形高斯表示**:采用球形高斯分布代替标准椭圆体模型,使得每个粒子可以被更简单地描述为位置、方向以及强度参数组合而成的形式[^1]。 - **高效采样策略**:利用球形对称性质减少不必要的冗余运算;同时针对不同视角下的可见性变化设计自适应调整机制以优化性能表现[^2]。 - **颜色分解**:为进一步增强对于具有镜面反射特性的物体表面特征捕捉能力,提出了将色彩信息拆解成漫反射与镜面反射两部分的方法。这不仅有助于区分高低频信号差异,还能够更好地匹配实际物理现象中光线传播规律[^3]。 ```python import numpy as np def spherical_gaussian(position, direction, intensity): """ 计算单个球形高斯项 参数: position -- 中心坐标向量 direction -- 方向单位向量 intensity -- 强度系数 返回值: sg_value -- 球形高斯响应值 """ # 假设输入已经过预处理转换到局部坐标系下 r_squared = sum([p*p for p in position]) dot_product = sum([d * p for d,p in zip(direction,position)]) exponent_term = -(r_squared - dot_product*dot_product)/(2*(intensity**2)) normalization_factor = 1 / ((np.sqrt(2*np.pi)*abs(intensity))**(len(position)-1)) return normalization_factor * np.exp(exponent_term) ``` #### 性能优势 得益于上述特性,基于球形高斯splatting 方法能够在保持高质量视觉呈现的同时显著降低计算成本,尤其适合应用于动态环境中快速更新视图的需求场合。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值