论文阅读笔记——Deformable Radial Kernel Splatting

DRK 论文

DRK(可变形径向核)的核心创新正是通过极坐标参数化与切平面投影,对传统3D高斯泼溅(3D-GS)进行了多维度的优化

传统 3DGS 依赖径向对称的高斯核,只能表示平滑、各向同性的形状(球体、椭圆体),DRK 通过可学习的多径向基能灵活变形为任意凸多边形或复杂平面体;高斯核的固有平滑性使其逼近锐利边界时需大量堆叠高斯函数,DRK 通过 L1/L2 范数组合和自适应分段重映射,独立控制边缘锐度。同时当参数退化为正交基时,等价于高斯核。

DRK

三维场景参数定义为: { μ , q , , s k , θ k , η , τ , o , s h } \{\mu,q,,s_k,\theta_k,\eta,\tau,o,sh\} {μ,q,,sk,θk,η,τ,o,sh} 其中 μ ∈ R 3 , q ∈ S O ( 3 ) , o , s h \mu\in R^3,q\in SO(3),o,sh μR3,qSO(3),o,sh 为 3D-GS 参数(位置、旋转、不透明度、球谐系数), { s k , θ k } k = 1 K \{s_k,\theta_k\}^{K}_{k=1} {sk,θk}k=1K 为径向基长度与极角, η ∈ ( 0 , 1 ) , τ ∈ ( − 1 , 1 ) \eta \in (0,1),\tau \in (-1,1) η(0,1),τ(1,1) 为边界曲率与锐度调节。
径向基通过极坐标下的 K 个控制点 { s k , θ k } \{s_k,\theta_k\} {sk,θk} 定义核的形状,在基 k 和基 k+1 之间的点 ( θ k < θ < θ k + 1 ) (\theta_k<\theta<\theta_{k+1}) (θk<θ<θk+1),定义相对角距离(角度的归一化至 [ 0 , π ] [0,\pi] [0,π]): Δ θ k = ( θ − θ k ) π θ k + 1 − θ k \Delta\theta_k=\frac{(\theta-\theta_k)\pi}{\theta_{k+1}-\theta_k} Δθk=θk+1θk(θθk)π ,代入 α \alpha α 合成有:
α = o ⋅ e x p ( − r 2 2 2 ( 1 + c o s ( Δ θ k ) 2 s k 2 + 1 − c o s ( Δ θ k ) 2 s k + 1 2 ) ) . ( 1 ) \alpha=o·exp\left(-\frac{r_2^2}{2}\left(\frac{1+cos(\Delta\theta_k)}{2s_k^2}+\frac{1-cos(\Delta\theta_k)}{2s_{k+1}^2}\right)\right). \qquad \qquad (1) α=oexp(2r22(2sk21+cos(Δθk)+2sk+121cos(Δθk))).(1)

此公式在 K = 4 , θ k = k π 2 , s 0 = s 2 = s u , s 1 = s 3 = s v K = 4,\theta_k=\frac{k\pi}{2},s_0=s_2=s_u,s_1=s_3=s_v K=4θk=2,s0=s2=su,s1=s3=sv 的情况下可退化为 2D-GS。

L1/L2 范数混合

在式(1)中尺度项 1 s ‾ 2 = ( 1 + c o s ( Δ θ k ) 2 s k 2 + 1 − c o s ( Δ θ k ) 2 s k + 1 2 ) \frac{1}{\overline{s}^2}=(\frac{1+cos(\Delta\theta_k)}{2s_k^2}+\frac{1-cos(\Delta\theta_k)}{2s_{k+1}^2}) s21=(2sk21+cos(Δθk)+2sk+121cos(Δθk)) 确保径向端点的轮廓平滑性(当 Δ θ k = 0 / π , d s ‾ d Δ θ k = 0 \Delta\theta_k=0/ \pi, \frac{d\overline{s}}{d\Delta\theta_k}=0 Δθk=0/π,dΔθkds=0)。但这种 L2 范数天然生成圆锥曲线,难以表征直线,故选择 L2 范数与 L1 范数的混合。
在相邻径向端点 e i = ( s i c o s θ i , s i s i n θ i ) e_i=(s_icos\theta_i,s_isin\theta_i) ei=(sicosθi,sisinθi) e i + 1 e_{i+1} ei+1 之间,对点 (u,v) 的 L1 范数计算为:
r 1 = ∣ ∣ ( e i e i + 1 ) − 1 ( u v ) ∣ ∣ 1 . ( 2 ) r_1=||\begin{pmatrix}e_i&e_i+1\end{pmatrix}^{-1}\begin{pmatrix}u\\ v\end{pmatrix}||_1. \qquad \qquad (2) r1=∣∣(eiei+1)1(uv)1.(2)
采用权重因子 η ∈ ( 0 , 1 ) \eta \in (0,1) η(0,1) 混合 L1 范数和 L2 范数,得到最终核函数:
α = o ⋅ exp ⁡ ( − 1 2 ( η r 1 2 + ( 1 − η ) r 2 2 s ˉ 2 ) ) . ( 3 ) \alpha=o\cdot\exp\left(-\frac{1}{2}\left(\eta r_1^2+(1-\eta)\frac{r_2^2}{\bar{s}^2}\right)\right). \qquad\qquad (3) α=oexp(21(ηr12+(1η)sˉ2r22)).(3)

分段边缘锐化

对于式(3)中 g = exp ⁡ ( − 1 2 ( η r 1 2 + ( 1 − η ) r 2 2 s ˉ 2 ) ) g=\exp\left(-\frac{1}{2}\left(\eta r_1^2+(1-\eta)\frac{r_2^2}{\bar{s}^2}\right)\right) g=exp(21(ηr12+(1η)sˉ2r22)),定义锐化函数 Ψ ( g ) \Psi(g) Ψ(g):
Ψ ( g ) = { 1 − τ 1 + τ g i f 0 ≤ g < 1 + τ 4 1 + τ 1 − τ g − τ 1 − τ i f 1 + τ 4 ≤ g < 3 − τ 4 ( 4 ) 1 − τ 1 + τ g + 2 τ 1 + τ i f 3 − τ 4 ≤ g ≤ 1 \Psi(g)=\left\{ \begin{array} {ccc}\frac{1-\tau}{1+\tau}g & \mathrm{if} & 0 & \leq g<\frac{1+\tau}{4} \\ \frac{1+\tau}{1-\tau}g-\frac{\tau}{1-\tau} & \mathrm{if} & \frac{1+\tau}{4} & \leq g<\frac{3-\tau}{4} \qquad \qquad (4)\\ \frac{1-\tau}{1+\tau}g+\frac{2\tau}{1+\tau} & \mathrm{if} & \frac{3-\tau}{4} & \leq g\leq1 \end{array}\right. Ψ(g)= 1+τ1τg1τ1+τg1ττ1+τ1τg+1+τ2τififif041+τ43τg<41+τg<43τ(4)g1
在这里插入图片描述
在这里插入图片描述
如图,通过该锐化函数,梯度重分布,将( g ∈ ( 0.25 , 0.75 ) g\in(0.25,0.75) g(0.25,0.75))向 ( 0 , 1 ) (0,1) (0,1) 压缩,在 τ = 1 \tau=1 τ=1 时,形成阶跃函数;在 τ = − 1 \tau=-1 τ=1 时,退化为原始平滑衰减。
最后得到 α = o ⋅ Ψ ( g ) \alpha = o ·\Psi(g) α=oΨ(g)

滤波

3D-GS 采用 EWA splatting 进行闭式高斯低通滤波,DRK 采取最大操作混合核函数与视角相关低通滤波器(在切平面内频率有界,正交视角下无界——DRK的每个图元是局部平面(由中心点μ和法向Rz定义的切平面),其几何细节仅在切平面内展开。):
α ~ = max ⁡ ( α , o ⋅ exp ⁡ ( − 1 2 ∣ r d ⋅ R z ∣ 2 ( Δ p w 2 s l 2 + Δ p h 2 s l 2 ) ) ) ( 5 ) \tilde{\alpha}=\max(\alpha,o\cdot\exp(-\frac{1}{2|r_d\cdot R_z|^2}(\frac{\Delta p_w^2}{s_l^2}+\frac{\Delta p_h^2}{s_l^2}))) \qquad \qquad (5) α~=max(α,oexp(2∣rdRz21(sl2Δpw2+sl2Δph2)))(5)

  • Δ p w , Δ p h Δp_w, Δp_h Δpw,Δph:像素与投影核中心的图像空间距离
  • r d ⋅ R z r_d⋅R_z rdRz:视角相关缩放因子(rdrd​为视线方向,RzRz​为平面法向),在近平行视角时趋近于 0,系统强制进行强滤波,保证切平面内信号频率不超过采样极限。正交视角下 |rd·Rz|=1,滤波项简化为 e x p ( Δ p w 2 s l 2 + Δ p h 2 s l 2 ) exp(\frac{\Delta p_w^2}{s_l^2}+\frac{\Delta p_h^2}{s_l^2}) exp(sl2Δpw2+sl2Δph2)
  • s l s_l sl:滤波半径控制参数
    相比 EWA splatting 积分计算,该方式更快。

核函数优化

传统 3D-GS 会将 3D 高斯投影到 2D 平面,生成一个轴对齐包围盒,来判断哪些图像分块(tile)需要渲染该高斯,如果高斯的投影是高度各向异性(如非常细长),此方法会产生很多不需要渲染的空分快。
DRK 的核函数由多个径向基定义,直接用 s k s_k sk 剔除会不准确,因为不透明度和锐化参数会影响核的实际范围,故而引入校准半径 s k c s_k^c skc
s k c = s k − log ⁡ ( Ψ − 1 ( e − 3 2 o ) ) . ( 6 ) s_k^c=s_k\sqrt{-\log\left(\Psi^{-1}(\frac{e^{-3^2}}{o})\right)}.\qquad \qquad (6) skc=sklog(Ψ1(oe32)) .(6)
再用校准半径 s k c s_k^c skc 计算每个径向基的端点坐标:
v k = μ + s k c ( cos ⁡ θ k R x + sin ⁡ θ k R y ) ( 7 ) v_k=\mu+s_k^c(\cos\theta_kR_x+\sin\theta_kR_y)\qquad \qquad (7) vk=μ+skc(cosθkRx+sinθkRy)(7)

深度排序优化

传统 3D-GS 仅依据高斯中心点 μ \mu μ 进行排序,导致:1)同一高斯在不同视角下的渲染顺序可能矛盾;2)中心点 μ \mu μ 不一定为最大密度区域。
DRK 提出由光线-核函数交点深度的排序策略:
r t = ( μ − r o ) T R z r d T R z . ( 8 ) r_t=\frac{(\mu-r_o)^TR_z}{r_d^TR_z}.\qquad \qquad (8) rt=rdTRz(μro)TRz.(8)
其中 R z R_z Rz 为切平面法向量。在实际应用中,计算开销为 O ( K ) , k ≤ 8 O(K), k≤8 O(K),k8 ,接近与 3D-GS 的 O(1)。

DRK 计算流程:

在这里插入图片描述

实验结果

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值