变分自编码器:从原理到人脸生成的实践
1. 自编码器的连续性问题
在自编码器中,潜在空间的连续性是一个关键问题。例如,虽然点 (2, –2) 解码后可能得到一个令人满意的数字 4 的图像,但没有机制保证点 (2.1, –2.1) 也能生成同样令人满意的数字 4 图像。
在二维空间中,这个问题可能不太明显。因为自编码器可利用的维度较少,它不得不将数字组压缩在一起,导致数字组之间的空间相对较小。然而,当我们在潜在空间中使用更多维度来生成更复杂的图像(如人脸)时,这个问题就变得更加突出。如果让自编码器自由使用潜在空间对图像进行编码,相似点组之间会出现巨大的间隙,且没有激励机制促使这些间隙生成清晰的图像。
2. 变分艺术展览的启示
为了解决上述问题,我们来看一个变分艺术展览的例子。N. Coder 先生决心让生成艺术展览取得成功,他邀请女儿 Epsilon 帮忙。他们改变了在墙上标记新画作的方式:
- 当新画作到达展览现场时,N. Coder 先生像以前一样选择墙上他认为适合放置标记来代表这幅艺术品的位置。但现在,他不再亲自将标记放在墙上,而是把他的想法告诉 Epsilon,由 Epsilon 决定标记的最终位置。Epsilon 通常会在 N. Coder 先生建议的位置附近放置标记。
- N. Coder 先生还会向女儿表明他对该位置的确定程度。他越确定,Epsilon 放置标记的位置就越接近他的建议。
- 旧系统的反馈机制只有因图像重建不佳导致的票房收入损失。现在增加了新的反馈源,Epsilon 很懒,当父亲让她把标记放在离墙中心(梯子所在位置)很远的地方时会感到恼火,她也不喜欢父亲对标记位置要求过于严格,或者父亲对标记位置缺乏信
超级会员免费看
订阅专栏 解锁全文
2103

被折叠的 条评论
为什么被折叠?



