LaTeRF:标签和文本驱动的对象辐射场技术解析
1. 真实场景下的对象提取与去噪
在真实场景中,LaTeRF 能够依据文本查询(如 “A dark green book”、“A mug” 和 “A wooden ukulele”)从场景里提取对象。不过,在具有纹理和复杂背景的真实场景中,会出现一些在训练视图中几乎不可见的小颗粒(低密度点)。这些小颗粒会融入背景或目标对象中而消失,但在过滤对象时会变得可见,从而导致对象渲染的背景中充满噪声。
为了去除这些噪声,可按照以下步骤操作:
1. 对每条光线上采样的密度进行平滑处理,将每个点的密度替换为其自身密度和直接相邻点密度的平均值,此操作重复 5 次。
2. 经过密度平滑后,大部分作为密度值突变峰值的小颗粒会趋近于零。
3. 基于密度应用硬阈值,过滤掉所有低于该阈值的点。
4. 通过在公式 10 中用对象性得分代替颜色,并对结果应用 sigmoid 函数来渲染对象掩码,同时假设沿每条光线在无限远处有一个高密度、低对象性得分的粒子。
5. 将对象掩码应用于有噪声的图像,从而获得去噪后的对象渲染结果。
去噪流程如下:
graph LR
A[原始图像] --> B[密度平滑]
B --> C[硬阈值过滤]
C --> D[渲染对象掩码]
D --> E[应用对象掩码]
E --> F[去噪图像]
2. 合成场景评估
2.1 合成场景生成
为了定量评估方法在
超级会员免费看
订阅专栏 解锁全文
2374

被折叠的 条评论
为什么被折叠?



