Beta-VAE论文阅读笔记

β-VAE是通过对传统变分自编码器(VAE)的损失函数进行改进,引入超参数β来实现数据表示的解纠缠。通过增加β值,模型能够学习到独立的潜在因子,有助于理解复杂数据的生成过程。文章还提出了一种度量解纠缠的线性分类器方法,通过训练和预测生成因子的索引来评估表示的质量。实验表明,当β=4时,模型表现出最佳的解纠缠特性。


前言

文章:β-VAE: LEARNING BASIC VISUAL CONCEPTS WITH A CONSTRAINED VARIATIONAL FRAMEWORK
原文链接:beta-vae
本文是在传统VAE的基础上,对VAE的loss进行了改进,在loss的第二项KL散度项加上一个超参数β,作者发现,随着增加β,传统的VAE有了disentanglement的特性,并做了大量的实验验证。
在我看来,全篇文章主要做了两件事情:

  1. 在VAE的基础上,增加超参数β,发现了disentanglement的特性(很可惜没有很好的解释原因是什么。)
  2. 提出一个disentanglement的度量方法

一、β-vae的提出

β-vae实际上非常简单,就是在传统vae的基础上,对VAE的loss进行了改进,在loss的第二项KL散度项加上一个超参数β。所以说,你需要先弄明白vae,这里推荐你看一下苏剑林老师的文章,这篇文章我感觉是讲vae讲的最好的一篇。
首先看一下传统VAE的loss:
在这里插入图片描述
分为两个部分,前面是重构项,后面是kl散度。
beta-vae的loss:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值