31、3D形状生成与分布式视频编码技术解析

最新推荐文章于 2025-09-07 07:41:17 发布

grape

最新推荐文章于 2025-09-07 07:41:17 发布

阅读量23

点赞数

CC 4.0 BY-SA版权

分类专栏：多媒体建模：从理论到实践的全面解析文章标签： 3D形状生成自编码器双向映射

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/grape/article/details/149517264

多媒体建模：从理论到实践的全面解析专栏收录该内容

48 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

3D形状生成与分布式视频编码技术解析

双向映射构建

在之前的工作中，我们为形状构建了统一表示，它由同构图结构、高维节点参数和边参数组成。这种表示的自由度较高，由于所有形状都来自同一对象类，它们的结构隐含着显著的相似性。我们的目标是降低表示空间的维度，以实现更紧凑的流形。

双向映射学习过程实际上是一个回归任务，我们要学习一个可逆函数 (f(\cdot))，将输入向量集 (x_i) 映射到对应的输出向量 (y_i)。一旦学习到这个映射，给定新的输入，我们就能预测输出。

经典的自编码器是一个三层神经网络，只有一个隐藏层。输入层和隐藏层可视为编码器，将输入向量转换为潜在代码；隐藏层和输出层构成解码器，根据潜在代码重建向量。自编码器训练是一个自监督过程，目标是使解码器重建的向量与原始向量相似。

为完成任务，我们构建了一个具有三个全连接隐藏层的自编码器，其结构如下：
设输入向量维度为 (n)，三个隐藏层的神经元数量分别为 (1.2n)、(0.5n)、(0.25n)。对于第 (i) 个隐藏层，有两个待训练的参数：权重矩阵 (W_i) 和偏置向量 (b_i)。输入为 (x_i) 时，输出 (y_i) 可通过以下公式计算：
(y_i = S_f(W_ix_i + b_i))
其中 (S_f) 是编码器的激活函数，这是单层编码过程。逐层编码后，输出即为最终代码，维度设为 2。解码过程则是编码的逆过程。
设解码器中第 (i) 个隐藏层的输出为 (\tilde{y}_i)，权重矩阵为 (\tilde{W}_i)，偏置向量为 (b_i)，解码过程如下：
(\tilde{x}_i = S_g(\tilde{W}_i\tilde{y}_i

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。