解纠缠表示学习与面部图像生成技术解析
在计算机视觉领域,解纠缠表示学习和面部图像生成是两个重要的研究方向。解纠缠表示学习旨在将数据中的不同因素分离开来,以便更好地理解和处理数据;而面部图像生成则致力于从给定的输入生成高质量的面部图像。本文将深入探讨相关技术,包括RED - Net的监督身份解纠缠和实验验证,以及CR - GAN在面部表示学习和多视图面部图像生成中的应用。
1. RED - Net的监督身份解纠缠
在编码器 - 解码器的瓶颈部分,简单地将瓶颈表示e拆分为两部分,并不能保证时间不变和时间变化因素能完全解耦。为了解决这个问题,RED - Net除了对非身份代码ep进行时间循环学习外,还采用了使用身份代码ei的人脸识别辅助任务。
监督身份解纠缠被表述为一个N路分类问题,N是训练序列中唯一个体的数量。身份代码ei与一个one - hot编码zi相关联,以指示每个身份的得分:
[z_i = f_{cls}(e_i; \theta_{cls}), f_{cls} : R^{W_e×H_e×C_i} → R^N]
其中,(f_{cls}(·; \theta_{cls}))是具有参数(\theta_{cls})的身份分类映射。身份任务使用N路交叉熵损失进行训练:
[\ell_{cls} = \frac{1}{N} \sum_{n = 1}^{N} z_n \log y_n + (1 - z_n) \log(1 - y_n)]
其中,(z_n)表示(z_i)中第n个元素的softmax激活值,(y_n)是身份注释(y_i)的第n个元素,(y_i)是一个one - hot向量,正确身份对应位置为1,其他位置为0。
所有三个任务
超级会员免费看
订阅专栏 解锁全文
25

被折叠的 条评论
为什么被折叠?



