3D形状生成与分布式视频编码技术解析
双向映射构建
在之前的工作中,我们为形状构建了统一表示,它由同构图结构、高维节点参数和边参数组成。这种表示的自由度较高,由于所有形状都来自同一对象类,它们的结构隐含着显著的相似性。我们的目标是降低表示空间的维度,以实现更紧凑的流形。
双向映射学习过程实际上是一个回归任务,我们要学习一个可逆函数 (f(\cdot)),将输入向量集 (x_i) 映射到对应的输出向量 (y_i)。一旦学习到这个映射,给定新的输入,我们就能预测输出。
经典的自编码器是一个三层神经网络,只有一个隐藏层。输入层和隐藏层可视为编码器,将输入向量转换为潜在代码;隐藏层和输出层构成解码器,根据潜在代码重建向量。自编码器训练是一个自监督过程,目标是使解码器重建的向量与原始向量相似。
为完成任务,我们构建了一个具有三个全连接隐藏层的自编码器,其结构如下:
设输入向量维度为 (n),三个隐藏层的神经元数量分别为 (1.2n)、(0.5n)、(0.25n)。对于第 (i) 个隐藏层,有两个待训练的参数:权重矩阵 (W_i) 和偏置向量 (b_i)。输入为 (x_i) 时,输出 (y_i) 可通过以下公式计算:
(y_i = S_f(W_ix_i + b_i))
其中 (S_f) 是编码器的激活函数,这是单层编码过程。逐层编码后,输出即为最终代码,维度设为 2。解码过程则是编码的逆过程。
设解码器中第 (i) 个隐藏层的输出为 (\tilde{y}_i),权重矩阵为 (\tilde{W}_i),偏置向量为 (b_i),解码过程如下:
(\tilde{x}_i = S_g(\tilde{W}_i\tilde{y}_i
超级会员免费看
订阅专栏 解锁全文
1344

被折叠的 条评论
为什么被折叠?



