一文了解NeRF在速度效果、动态、少视角泛化、无界和大场景等方向上的改进思路

本文记录下笔者最近对NeRF在速度效果、动态、少视角泛化、无界和大场景五个大方向上经典改进算法的学习理解。如有错误,欢迎评论指出。


一.速度、效果

1.Mip-NeRF: A Multiscale Representation for Anti-Aliasing Neural Radiance Fields

用于解决在摄像机远离物体时,原始NeRF渲染结果存在的混叠问题,其原因在于点采样特征忽略了每条光线所观察的体积的形状和大小,因此两个不同的相机在不同比例下对同一位置进行成像可能会产生相同的模棱两可的点采样特征。基于该发现,替代单一射线为圆锥视锥体(Conical Frustum),此时像素的颜色是像素视锥体内所有传入辐射的积分。由于圆锥视锥体为连续的空间,直接求解该空间内所有采样点的位置编码的均值不方便,改用三维高斯分布来近似整个空间。根据高斯分布的特性,进一步计算位置编码对应的高斯分布(原先时一个点,现在是一个分布),最后从这个高斯分布采样位置编码,即计算期望作为最后的位置编码。此外,由于这种编码方式允许在不同的尺度上对场景进行描述,只需要一个MLP即可训练。

2. Instant neural graphics primitives with a multiresolution hash encoding

解决NeRF速度慢的问题,改进点主要在位置编码上。对于方向的位置编码,改用球谐函数(在图形学中,其与颜色关联强,学习起来更容易)。对于采样点的位置编码,原始编码需要自适应选择编码中某几维数据来生成体密度与颜色值,从而导致导致网络规模过大,计算效率低,现改为由显式的多分辨率网格进行插值和拼接得到(相当于再不同分辨率网格上已经做出了高低频的选择),且该网格的特征也由梯度回传学习而来。通过改进编码方式允许在不牺牲质量的情况下使用较小的网络,再加上纯cuda的原生加速实现,将NeRF的训练时间从小时级压缩到分钟级甚至是秒级。

二.动态

4.Dynamic Neural Radiance Fields for Monocular 4D Facial Avatar Reconstruction

适用场景为人头动相机不动,此时采样点位置是通过人头姿态来转换到一个Cananci

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值