论文阅读笔记——Deformable 3DGS，4DGS

原创

已于 2025-03-29 17:42:43 修改 · 2.9k 阅读

36 ·

CC 4.0 BY-SA版权

文章标签：

#论文阅读 #笔记 #3d #3DGS #三维重建 #人工智能

于 2025-03-25 12:00:00 首次发布

Deformable 3DGS

Deformable 3DGS 论文

3DGS 只能解决静态场景，对于动态场景只能逐帧重建，浪费时间，存储开销大，无连续性；在 3DGS 基础上，引入变形场使高斯分布随时间变化，从而支持动态内容。该方法类似在 4D 空间压缩数据，故事“记录”动态信息，不能让静态场景“变得动态”。（变形场调整适合规则运动）

在这里插入图片描述
通过一个 变形场（类似 NeRF） 和三维高斯分布来 解耦运动和几何结构（动态三维高斯分布可以映射到规范空间中）。
输入一组单目动态场景图像，SfM 校准的时间标签、相机姿态和稀疏点云，由此创建一组高斯分布 $G(x,r,s,\sigma)$ 。
给定时间 t 和三维高斯中心 x 作为输入，通过 MLP 产生偏移量将规范空间转换到变形高斯空间：
在这里插入图片描述
$\begin{aligned} (\delta x,\delta r, \delta s)=F_\theta(\gamma(sg(x)), \gamma(t)) \\\gamma(p)=(sin(2^k\pi p),cos(2^k\pi p))_{k=0}^{L=1} \end{aligned}$
其中 $s g (\cdot)$ 为停止梯度， $\gamma$ 表示位置编码（实验表明：作用于输入可以增强细节）（个人感觉是让规范场和变形场交替迭代优化）

因为 colmap 从数据集中估计的姿态不准确，（显示渲染会放大这种抖动，MLP 因其连续性会缩小这种扰动），本文提出 AST 机制——在训练过程中向时间维度注入线性衰减的高斯噪声，模拟位姿误差的扰动：（使得训练出来的变形场在时域上平滑，减少抖动）
$\begin{aligned} \Delta = \mathcal{F$

最低0.47元/天解锁文章