李宏毅深度学习笔记14(GAN-02)

本文探讨了在深度学习中如何控制生成对象,主要介绍Conditional GAN在Text-to-Image、image-to-image、patch GAN和speech enhancement、video generation等场景的应用。通过改变Discriminator的输入实现条件生成,解决了传统方法的局限性,增强了生成效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本节考虑如何控制生成对象。将GAN变为Conditional GAN,两者的Generator是相同的,不同的是Discriminator。

Text-to-Image

传统的做法:如下图所示,但是如果训练的图片是多个角度的,这样机器两边都学习到就会产生不好的结果,让大家看不出来像什么。
在这里插入图片描述
利用GAN去做:存在的问题是discriminator只会判断图片是否清晰是否真实,而无法按条件生成想要的图片。
在这里插入图片描述

最后用到Conditional GAN:不改变generator的部分,只改变discriminator的部分,给discriminator两个输入,一个是条件,一个是对象
在这里插入图片描述

image-to-image

传统方法跟Text-to-Image的传统方法一样,就是直接输入一副图片。但是用了GAN+close之后效果明显增强(不要太注重他们的原理,先了解什么东西会带来什么效果)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值