GAN系列之 pix2pixGAN 网络原理介绍以及论文解读

码农男孩

已于 2022-04-30 21:04:59 修改

阅读量1.2w

点赞数 16

CC 4.0 BY-SA版权

分类专栏： GANs 文章标签：计算机视觉人工智能深度学习生成对抗网络 GAN

于 2022-04-07 21:36:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_62128864/article/details/124026977

Pix2Pix GAN是一种基于条件对抗网络的图像到图像转换模型，用于端到端的图像处理任务。它采用生成器和判别器结构，通过U-Net设计增加跳跃连接，确保输入输出间信息的共享。判别器采用Patch-D设计，以小块图像进行真假判断。损失函数结合L1和GAN损失，兼顾图像的高频和低频信息。Pix2Pix适用于图像上色、风格迁移等任务，但需要成对的数据集进行训练。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、什么是pix2pix GAN

论文：《Image-to-Image Translation with Conditional Adversarial Networks》

pix2pix GAN主要用于图像之间的转换，又称图像翻译。图像处理的很多问题都是将一张输入的图片转变为一张对应的输出图片，端到端的训练。如果要根据每个问题设定一个特定的loss function 来让CNN去优化，通常都是训练CNN去缩小输入跟输出的欧氏距离，但这样通常会得到比较模糊的输出。

普通的GAN接收的G部分的输入是随机向量，输出是图像； D部分接收的输入是图像(生成的或是真实的)，输出是对或者错。这样G和D联手就能输出真实的图像。

Pix2pixgan本质上是一个cgan，图片 x 作为此cGAN的条件，需要输入到G和D中。 G的输入是x（x 是需要转换的图片），输出是生成的图片G(x)。 D则需要分辨出{x,G(x)}和{x, y}。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

码农男孩 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。