zero-shot learning系列论文(1)A Generative Model For Zero Shot Learning Using Conditional Variational

本文探讨了一种创新的零-shot学习方法,通过条件变分自编码器(cVAE)解决领域转移问题,为未见类别生成样本并用于分类。方法核心在于通过语义嵌入指导图像生成,生成的伪数据帮助减少类别间的偏见。模型还面临模态丢失挑战,通过调整解决策略改善数据拟合。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 出处

2018 CVPR workshop

2. 问题

已有的zero-shot learning方法尝试通过一些迁移函数建模类属性空间和图像空间之间的关系,以便将图像空间对应到unseen class

3. 方法

学习一个class embedding到image space的映射函数,但由于图像空间的不连续性,从seen class images上学到的映射无法捕获unseen classes的关系(domain shift问题)

作者没有直接建模迁移函数,而是将问题视为“数据丢失”(相当于训练的时候,丢失了unseen class),将class embedding vector作为条件,通过VAEs建模图像生成过程,把生成的数据填充unseen classes缺失的数据

通过cVAE,利用给定的属性生成样本,使用生成的样本对unseen classes分类

**方法的核心:**为unseen classes生成样本

4. 框架

4.1 整体结构

在这里插入图片描述
训练阶段:

对于ZSL来说:

  1. 训练CVAE

    encoder将x和语义嵌入A拼接作为输入,输出高斯参数向量,然后在学到的高斯分布中随机选取z

    对于每一个unseen class,decoder将z和语义嵌入A拼接作为输入,在给定隐变量z的情况下重构类别y所对应的x(pseudo traindata)

    使用pseudo traindata训练SVM分类器

对于GZSL来说:

一种直观的方法是使用seen classes原始的训练数据和unseen classes生成的数据来训练SVM,但会产生bias towards the seen classes

因此,不仅为unseen classes生成pseudo data,也为seen classes生成pseudo data

测试阶段:

对真实的unseen classes的图像使用SVM分类器分类

5. 启发

  1. 模型存在mode dropping问题,实际的数据分布峰值有多个,然而生成的图像是单峰的,训练过程只拟合了其中一个

    (通常是通过改变散度来解决)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值