DRK(可变形径向核)的核心创新正是通过极坐标参数化与切平面投影,对传统3D高斯泼溅(3D-GS)进行了多维度的优化。
传统 3DGS 依赖径向对称的高斯核,只能表示平滑、各向同性的形状(球体、椭圆体),DRK 通过可学习的多径向基能灵活变形为任意凸多边形或复杂平面体;高斯核的固有平滑性使其逼近锐利边界时需大量堆叠高斯函数,DRK 通过 L1/L2 范数组合和自适应分段重映射,独立控制边缘锐度。同时当参数退化为正交基时,等价于高斯核。
DRK
三维场景参数定义为:
{
μ
,
q
,
,
s
k
,
θ
k
,
η
,
τ
,
o
,
s
h
}
\{\mu,q,,s_k,\theta_k,\eta,\tau,o,sh\}
{μ,q,,sk,θk,η,τ,o,sh} 其中
μ
∈
R
3
,
q
∈
S
O
(
3
)
,
o
,
s
h
\mu\in R^3,q\in SO(3),o,sh
μ∈R3,q∈SO(3),o,sh 为 3D-GS 参数(位置、旋转、不透明度、球谐系数),
{
s
k
,
θ
k
}
k
=
1
K
\{s_k,\theta_k\}^{K}_{k=1}
{sk,θk}k=1K 为径向基长度与极角,
η
∈
(
0
,
1
)
,
τ
∈
(
−
1
,
1
)
\eta \in (0,1),\tau \in (-1,1)
η∈(0,1),τ∈(−1,1) 为边界曲率与锐度调节。
径向基通过极坐标下的 K 个控制点
{
s
k
,
θ
k
}
\{s_k,\theta_k\}
{sk,θk} 定义核的形状,在基 k 和基 k+1 之间的点
(
θ
k
<
θ
<
θ
k
+
1
)
(\theta_k<\theta<\theta_{k+1})
(θk<θ<θk+1),定义相对角距离(角度的归一化至
[
0
,
π
]
[0,\pi]
[0,π]):
Δ
θ
k
=
(
θ
−
θ
k
)
π
θ
k
+
1
−
θ
k
\Delta\theta_k=\frac{(\theta-\theta_k)\pi}{\theta_{k+1}-\theta_k}
Δθk=θk+1−θk(θ−θk)π ,代入
α
\alpha
α 合成有:
α
=
o
⋅
e
x
p
(
−
r
2
2
2
(
1
+
c
o
s
(
Δ
θ
k
)
2
s
k
2
+
1
−
c
o
s
(
Δ
θ
k
)
2
s
k
+
1
2
)
)
.
(
1
)
\alpha=o·exp\left(-\frac{r_2^2}{2}\left(\frac{1+cos(\Delta\theta_k)}{2s_k^2}+\frac{1-cos(\Delta\theta_k)}{2s_{k+1}^2}\right)\right). \qquad \qquad (1)
α=o⋅exp(−2r22(2sk21+cos(Δθk)+2sk+121−cos(Δθk))).(1)
此公式在 K = 4 , θ k = k π 2 , s 0 = s 2 = s u , s 1 = s 3 = s v K = 4,\theta_k=\frac{k\pi}{2},s_0=s_2=s_u,s_1=s_3=s_v K=4,θk=2kπ,s0=s2=su,s1=s3=sv 的情况下可退化为 2D-GS。
L1/L2 范数混合
在式(1)中尺度项
1
s
‾
2
=
(
1
+
c
o
s
(
Δ
θ
k
)
2
s
k
2
+
1
−
c
o
s
(
Δ
θ
k
)
2
s
k
+
1
2
)
\frac{1}{\overline{s}^2}=(\frac{1+cos(\Delta\theta_k)}{2s_k^2}+\frac{1-cos(\Delta\theta_k)}{2s_{k+1}^2})
s21=(2sk21+cos(Δθk)+2sk+121−cos(Δθk)) 确保径向端点的轮廓平滑性(当
Δ
θ
k
=
0
/
π
,
d
s
‾
d
Δ
θ
k
=
0
\Delta\theta_k=0/ \pi, \frac{d\overline{s}}{d\Delta\theta_k}=0
Δθk=0/π,dΔθkds=0)。但这种 L2 范数天然生成圆锥曲线,难以表征直线,故选择 L2 范数与 L1 范数的混合。
在相邻径向端点
e
i
=
(
s
i
c
o
s
θ
i
,
s
i
s
i
n
θ
i
)
e_i=(s_icos\theta_i,s_isin\theta_i)
ei=(sicosθi,sisinθi) 和
e
i
+
1
e_{i+1}
ei+1 之间,对点 (u,v) 的 L1 范数计算为:
r
1
=
∣
∣
(
e
i
e
i
+
1
)
−
1
(
u
v
)
∣
∣
1
.
(
2
)
r_1=||\begin{pmatrix}e_i&e_i+1\end{pmatrix}^{-1}\begin{pmatrix}u\\ v\end{pmatrix}||_1. \qquad \qquad (2)
r1=∣∣(eiei+1)−1(uv)∣∣1.(2)
采用权重因子
η
∈
(
0
,
1
)
\eta \in (0,1)
η∈(0,1) 混合 L1 范数和 L2 范数,得到最终核函数:
α
=
o
⋅
exp
(
−
1
2
(
η
r
1
2
+
(
1
−
η
)
r
2
2
s
ˉ
2
)
)
.
(
3
)
\alpha=o\cdot\exp\left(-\frac{1}{2}\left(\eta r_1^2+(1-\eta)\frac{r_2^2}{\bar{s}^2}\right)\right). \qquad\qquad (3)
α=o⋅exp(−21(ηr12+(1−η)sˉ2r22)).(3)
分段边缘锐化
对于式(3)中
g
=
exp
(
−
1
2
(
η
r
1
2
+
(
1
−
η
)
r
2
2
s
ˉ
2
)
)
g=\exp\left(-\frac{1}{2}\left(\eta r_1^2+(1-\eta)\frac{r_2^2}{\bar{s}^2}\right)\right)
g=exp(−21(ηr12+(1−η)sˉ2r22)),定义锐化函数
Ψ
(
g
)
\Psi(g)
Ψ(g):
Ψ
(
g
)
=
{
1
−
τ
1
+
τ
g
i
f
0
≤
g
<
1
+
τ
4
1
+
τ
1
−
τ
g
−
τ
1
−
τ
i
f
1
+
τ
4
≤
g
<
3
−
τ
4
(
4
)
1
−
τ
1
+
τ
g
+
2
τ
1
+
τ
i
f
3
−
τ
4
≤
g
≤
1
\Psi(g)=\left\{ \begin{array} {ccc}\frac{1-\tau}{1+\tau}g & \mathrm{if} & 0 & \leq g<\frac{1+\tau}{4} \\ \frac{1+\tau}{1-\tau}g-\frac{\tau}{1-\tau} & \mathrm{if} & \frac{1+\tau}{4} & \leq g<\frac{3-\tau}{4} \qquad \qquad (4)\\ \frac{1-\tau}{1+\tau}g+\frac{2\tau}{1+\tau} & \mathrm{if} & \frac{3-\tau}{4} & \leq g\leq1 \end{array}\right.
Ψ(g)=⎩
⎨
⎧1+τ1−τg1−τ1+τg−1−ττ1+τ1−τg+1+τ2τififif041+τ43−τ≤g<41+τ≤g<43−τ(4)≤g≤1
如图,通过该锐化函数,梯度重分布,将(
g
∈
(
0.25
,
0.75
)
g\in(0.25,0.75)
g∈(0.25,0.75))向
(
0
,
1
)
(0,1)
(0,1) 压缩,在
τ
=
1
\tau=1
τ=1 时,形成阶跃函数;在
τ
=
−
1
\tau=-1
τ=−1 时,退化为原始平滑衰减。
最后得到
α
=
o
⋅
Ψ
(
g
)
\alpha = o ·\Psi(g)
α=o⋅Ψ(g)
滤波
3D-GS 采用 EWA splatting 进行闭式高斯低通滤波,DRK 采取最大操作混合核函数与视角相关低通滤波器(在切平面内频率有界,正交视角下无界——DRK的每个图元是局部平面(由中心点μ和法向Rz定义的切平面),其几何细节仅在切平面内展开。):
α
~
=
max
(
α
,
o
⋅
exp
(
−
1
2
∣
r
d
⋅
R
z
∣
2
(
Δ
p
w
2
s
l
2
+
Δ
p
h
2
s
l
2
)
)
)
(
5
)
\tilde{\alpha}=\max(\alpha,o\cdot\exp(-\frac{1}{2|r_d\cdot R_z|^2}(\frac{\Delta p_w^2}{s_l^2}+\frac{\Delta p_h^2}{s_l^2}))) \qquad \qquad (5)
α~=max(α,o⋅exp(−2∣rd⋅Rz∣21(sl2Δpw2+sl2Δph2)))(5)
- Δ p w , Δ p h Δp_w, Δp_h Δpw,Δph:像素与投影核中心的图像空间距离
- r d ⋅ R z r_d⋅R_z rd⋅Rz:视角相关缩放因子(rdrd为视线方向,RzRz为平面法向),在近平行视角时趋近于 0,系统强制进行强滤波,保证切平面内信号频率不超过采样极限。正交视角下 |rd·Rz|=1,滤波项简化为 e x p ( Δ p w 2 s l 2 + Δ p h 2 s l 2 ) exp(\frac{\Delta p_w^2}{s_l^2}+\frac{\Delta p_h^2}{s_l^2}) exp(sl2Δpw2+sl2Δph2)
-
s
l
s_l
sl:滤波半径控制参数
相比 EWA splatting 积分计算,该方式更快。
核函数优化
传统 3D-GS 会将 3D 高斯投影到 2D 平面,生成一个轴对齐包围盒,来判断哪些图像分块(tile)需要渲染该高斯,如果高斯的投影是高度各向异性(如非常细长),此方法会产生很多不需要渲染的空分快。
DRK 的核函数由多个径向基定义,直接用
s
k
s_k
sk 剔除会不准确,因为不透明度和锐化参数会影响核的实际范围,故而引入校准半径
s
k
c
s_k^c
skc:
s
k
c
=
s
k
−
log
(
Ψ
−
1
(
e
−
3
2
o
)
)
.
(
6
)
s_k^c=s_k\sqrt{-\log\left(\Psi^{-1}(\frac{e^{-3^2}}{o})\right)}.\qquad \qquad (6)
skc=sk−log(Ψ−1(oe−32)).(6)
再用校准半径
s
k
c
s_k^c
skc 计算每个径向基的端点坐标:
v
k
=
μ
+
s
k
c
(
cos
θ
k
R
x
+
sin
θ
k
R
y
)
(
7
)
v_k=\mu+s_k^c(\cos\theta_kR_x+\sin\theta_kR_y)\qquad \qquad (7)
vk=μ+skc(cosθkRx+sinθkRy)(7)
深度排序优化
传统 3D-GS 仅依据高斯中心点
μ
\mu
μ 进行排序,导致:1)同一高斯在不同视角下的渲染顺序可能矛盾;2)中心点
μ
\mu
μ 不一定为最大密度区域。
DRK 提出由光线-核函数交点深度的排序策略:
r
t
=
(
μ
−
r
o
)
T
R
z
r
d
T
R
z
.
(
8
)
r_t=\frac{(\mu-r_o)^TR_z}{r_d^TR_z}.\qquad \qquad (8)
rt=rdTRz(μ−ro)TRz.(8)
其中
R
z
R_z
Rz 为切平面法向量。在实际应用中,计算开销为
O
(
K
)
,
k
≤
8
O(K), k≤8
O(K),k≤8 ,接近与 3D-GS 的 O(1)。