zero-shot learning系列论文（1）A Generative Model For Zero Shot Learning Using Conditional Variational

原创于 2022-02-23 21:28:21 发布

· 873 阅读

·

0

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #计算机视觉 #zero-shot #零样本学习

论文阅读同时被 3 个专栏收录

18 篇文章

订阅专栏

zero-shot learning

2 篇文章

订阅专栏

zero-shot classification

1 篇文章

订阅专栏

本文探讨了一种创新的零-shot学习方法，通过条件变分自编码器（cVAE）解决领域转移问题，为未见类别生成样本并用于分类。方法核心在于通过语义嵌入指导图像生成，生成的伪数据帮助减少类别间的偏见。模型还面临模态丢失挑战，通过调整解决策略改善数据拟合。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 出处

2018 CVPR workshop

2. 问题

已有的zero-shot learning方法尝试通过一些迁移函数建模类属性空间和图像空间之间的关系，以便将图像空间对应到unseen class

3. 方法

学习一个class embedding到image space的映射函数，但由于图像空间的不连续性，从seen class images上学到的映射无法捕获unseen classes的关系（domain shift问题）

作者没有直接建模迁移函数，而是将问题视为“数据丢失”（相当于训练的时候，丢失了unseen class），将class embedding vector作为条件，通过VAEs建模图像生成过程，把生成的数据填充unseen classes缺失的数据

通过cVAE，利用给定的属性生成样本，使用生成的样本对unseen classes分类

**方法的核心:**为unseen classes生成样本

4. 框架

4.1 整体结构

在这里插入图片描述
训练阶段：

对于ZSL来说：

训练CVAE

encoder将x和语义嵌入A拼接作为输入，输出高斯参数向量，然后在学到的高斯分布中随机选取z

对于每一个unseen class，decoder将z和语义嵌入A拼接作为输入，在给定隐变量z的情况下重构类别y所对应的x（pseudo traindata）

使用pseudo traindata训练SVM分类器

对于GZSL来说：

一种直观的方法是使用seen classes原始的训练数据和unseen classes生成的数据来训练SVM，但会产生bias towards the seen classes

因此，不仅为unseen classes生成pseudo data，也为seen classes生成pseudo data

测试阶段：

对真实的unseen classes的图像使用SVM分类器分类

5. 启发

模型存在mode dropping问题，实际的数据分布峰值有多个，然而生成的图像是单峰的，训练过程只拟合了其中一个

（通常是通过改变散度来解决）

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。