Animatable Neural Radiance Fields for Modeling Dynamic Human Bodies对着这篇论文作一个讲解

为什么想去讲一下,因为我还是去搜了一下关于这个文章的讲解,基本上没有说讲的很透彻的,基本上就是把论文里的内容选择性的去翻译了一下,我也不知道那样有啥用。那么接下里我去讲解一下这篇论文的实现。按照惯例还是先上图,这个图也就是这个论文的大致框架。按照这个图来讲解。先说一下哈,如果有感觉不清楚的,去看一下我前几个论文。我在这只去讲解关于这篇论文的独特的地方,共性,不会花很长时间去讲解。

首先看这个图由几部分组成,横向去看一共四部分吧分别是observation space,还有一个混合权重场和那个Eq.4这个可以看成一个,这个东西其实他就是相当于前门几篇文章中的bending网络(对光线进行偏移变形的也可以说是对射线上采样点的偏移对把,还有如果不明白这里的去看一下我前面的文章,我不想重复的去讲一个东西,太浪费时间了)接下来就是canonical space这个是和前几篇文章的概念一样的一点都没有变就是一个标准的空间(也就是它这里面存在的信息是就是某一个时刻的物体的状态,不理解可以看一下前面几篇文章,那里细讲了)接下来就是一个原始的nerf,这个标准空间中的物体姿态信息都是在这个标准的nerf中存储的对吧,其实它和原始的nerf还是有一个地方不一样的就是它在预测颜色的时候是多加了一个appearance codeLi 也就是上面图片也标出来了,原始nerf在预测颜色的时候就多加了方向d。然后nerf的下面是不是还有一个混合权重场(neural blend weight field)这个其实和前面那个一样,是不是看到这一脸懵,这都是什么啊,别急我接下来去逐个的去讲解一下。

首先看第一个图,也就是observation space 这个视角采样,这些东西我就都不讲了,前面讲过,然后选择其中的一个样本点x举例,去看整个流程,首先这个样本点是不是要经过这个神经混合权重场的东西,这是算了个什么东西啊,为啥要用这个东西呢,为啥不能像前面几篇论文讲的一样直接用一个全连接层的一个网络去进行偏转呢,因为这篇文章是不是重点是放在重建人体上,因为只是一种物体,它是不是有很多共性,比如说正常人的骨头关节是不是都是固定的,这些是不是一些先验知识,我们之前就知道的,正是因为这些它才用这里的这个结构,他是不是可以增加一些“约束”(因为加了先验知识对它的限制)去使结果更容易逼近全局最优解,相比之前那种直接加个多层感知机(MLP)要有更多的限制,也就更不会去使得到的结果是局部最优对吧,我刚才一直说是不是其实它这个结构就是一个使样本点发生器偏转的一个东西,并且它是加了人体一些先验知识的,它具体是什么样的呢,首先这个neural blend weight 这是个什么东西,还是得先了解与一下SMPL,什么是SMPL呢?就可以把它认为是一个它定义了人体大致的结构,就是有6890 个顶点和 13776 个三角形面的三维网格并且模型由 24 个关节组成,每个关节有对应的旋转矩阵,并且个顶点有一个 24 维的混合权重向量,表示该顶点受不同关节的影响程度,这里的混合权重向量的概念就出来了,其实咱们要求得也就是这个24维的混合权重向量,再往下的话我觉得来看这个公式更好理解一点

这个公式就是描述的是这个部分首先这个是代表的什么呢这就是代表的这个上面这个网络,ψi是作为一个输入,这个是这一帧的一个潜在编码(这个是什么东西我前面文章也详细讲过)还有就是那个样本点作为输入,然后输出的就是这个东西,它是个24维的对吧,接下来看这个是什么东西呢,它其实就是用咱们刚才说的那个SMLP算出来的,咱们训练的时候不是输入的是视频么,视频的每一帧然后提取出

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值