前言
文章:β-VAE: LEARNING BASIC VISUAL CONCEPTS WITH A CONSTRAINED VARIATIONAL FRAMEWORK
原文链接:beta-vae
本文是在传统VAE的基础上,对VAE的loss进行了改进,在loss的第二项KL散度项加上一个超参数β,作者发现,随着增加β,传统的VAE有了disentanglement的特性,并做了大量的实验验证。
在我看来,全篇文章主要做了两件事情:
- 在VAE的基础上,增加超参数β,发现了disentanglement的特性(很可惜没有很好的解释原因是什么。)
- 提出一个disentanglement的度量方法
一、β-vae的提出
β-vae实际上非常简单,就是在传统vae的基础上,对VAE的loss进行了改进,在loss的第二项KL散度项加上一个超参数β。所以说,你需要先弄明白vae,这里推荐你看一下苏剑林老师的文章,这篇文章我感觉是讲vae讲的最好的一篇。
首先看一下传统VAE的loss:

分为两个部分,前面是重构项,后面是kl散度。
beta-vae的loss:

β-VAE是通过对传统变分自编码器(VAE)的损失函数进行改进,引入超参数β来实现数据表示的解纠缠。通过增加β值,模型能够学习到独立的潜在因子,有助于理解复杂数据的生成过程。文章还提出了一种度量解纠缠的线性分类器方法,通过训练和预测生成因子的索引来评估表示的质量。实验表明,当β=4时,模型表现出最佳的解纠缠特性。
最低0.47元/天 解锁文章
1021

被折叠的 条评论
为什么被折叠?



