9、结合Transformer生成器与卷积判别器的混合模型研究

最新推荐文章于 2025-11-03 18:53:17 发布

c6d7e8f9g

最新推荐文章于 2025-11-03 18:53:17 发布

阅读量35

点赞数

CC 4.0 BY-SA版权

分类专栏：解读《KI 2021：人工智能的进展》文章标签： Transformer 卷积判别器生成对抗网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c6d7e8f9g/article/details/149374208

解读《KI 2021：人工智能的进展》专栏收录该内容

42 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

结合Transformer生成器与卷积判别器的混合模型研究

1. 研究背景与相关工作

生成模型的目标是用生成的数据分布近似真实数据分布。早期，图像合成的生成模型大多仅使用卷积层构建，但随着Transformer的兴起，新的拓扑结构开始打破卷积的主导地位。

1.1 基于CNN的生成模型

生成对抗网络（GAN） ：通过优化Jensen - Shannon散度来最小化真实分布和生成分布之间的距离。从博弈论角度看，这是生成器和判别器之间的极小极大博弈。生成器旨在生成可信数据，判别器则要区分生成数据和真实数据，并惩罚生成不真实结果的生成器。
变分自编码器（VAE） ：通过最小化两个概率分布之间的Kullback - Leibler（KL）散度来显式估计真实数据的概率密度函数。它由编码器和解码器组成，编码器将输入映射到低维潜在表示，解码器从潜在表示重建输入，训练收敛后可从预定义分布采样生成新样本。

1.2 基于注意力机制的生成模型

Image Transformer ：将Transformer推广到图像生成的序列建模中，具有可处理的似然性。
ImageGPT ：通过在图像生成任务上预训练Transformer进行无监督表示学习，学习到的表示可用于图像分类等下游任务。
TransGAN ：引入了完全无卷积、基于纯自注意力块的GAN范式。其生成器结合了Transfo

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。