【论文笔记】pix2pix Image-to-Image Translation with Conditional Adversarial Networks

鲤鱼王的成长之路

于 2022-05-13 16:40:48 发布

阅读量1k

点赞数

分类专栏：论文复现文章标签：计算机视觉深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Michael_Cretu_/article/details/123347156

版权

【论文笔记】pix2pix Image-to-Image Translation with Conditional Adversarial Networks

1.工作概述
2.项目背景
3.相关工作
4.模型结构
- 4.1判别器
- 4.2生成器
5.方法
6.评价测度
- 6.1真假感知研究
- 6.2FCN分数
7.对于损失函数的实验结果分析
- 7.1消融实验1：验证损失函数里cGAN和L1项的重要性。
- 7.1消融实验2：验证cGAN相对于GAN的优越性。
8.对于生成器结构的实验结果分析
9.对于不同Patch的实验结果分析
10.感知实验结果分析
11.语义分割实验

原文链接：https://phillipi.github.io/pix2pix/

1.工作概述

本文研究了条件对抗网络作为图像到图像风格迁移问题的通用解决方案。这些网络不仅学习从输入图像到输出图像的映射，而且学习一个损失函数来训练这种映射。这就意味着，我们可以给出一种通用的解决方案来处理那些需要不同的“损失函数”的场景。因此我们的主要贡献分成两部分：第一是证明了cGAN对风格迁移的通用性，第二是提出了一款框架去实现良好的结果。

2.项目背景

一张图片有很多种表示方式，例如：RGB、梯度场、边缘图、语义标签地图等。

GAN的目标：让我们生成的图像以假乱真（最小化损失函数），同时自动学习损失函数。

3.相关工作

结构化损失：我们将图像匹配视为“非结构化”的任务，因为像素间彼此独立，而cGAN企图处理的是结构化的损失，所以就可以用它来惩罚图像匹配任务中的“结构化”部分。

cGAN：以往有人使用cGAN，也有人用无条件的GAN并附加其它约束项（例如L2范数）去强迫输入成为输出的条件。

4.模型结构

4.1判别器

使用了PatchGAN，在Patch尺度上惩罚结构，并验证了改变补丁大小对于模型结构的影响。L1损失项可以确保低频的准确性，但会带来高频的模糊，因此判别器主要负责保证高频的准确性，这就需要我们去关注图像中的局部结构，因此我们提出了“只会在局部结构中施加惩罚项”的PatchGAN。该鉴别器试图对图像中的每个N × N块进行

最低0.47元/天解锁文章

鲤鱼王的成长之路

博客等级

码龄6年

24
原创

103
点赞

490
收藏

38
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 【故障诊断】git无权限 git@github.com: Permission denied (publickey). fatal: Could not read from remote reposi

下一篇：: 【故障诊断】cv2.imwrite无法写入图片，但程序就是不报错

最新评论

【科研笔记】《Semi-Supervised PR Virtual Staining for Breast Histopathological Images》
qmh1114: 您好，我有一批sdpc文件，但是转换为svs后使用openslide读取时显示“Warning, Nonstandard tile width 616, convert file”，我检查了下是因为扫描仪扫出来的tile并不是512*512，这种情况应该如何处理啊
【论文笔记】CycleGAN（基于PyTorch框架）
蘖闑: 你好，cycleGAN网络中定义生成器用到ResnetGenerator，其中model += [nn.ReflectionPad2d(3)]，但是ReflectionPad2d无权重无偏置，所以不会保存到.pth文件中，但是在测试的时候又有ReflectionPad2d，导致测试时加载训练好的权重出现RuntimeError: Error(s) in loading state_dict for ResnetGenerator: Missing key(s) in state_dict: "model.10.conv_block.6.weight", "model.10.conv_block.6.bias", "model.11.conv_block.6.weight", "model.11.conv_block.6.bias", "model.12.conv_block.6.weight", "model.12.conv_block.6.bias", "model.13.conv_block.6.weight", "model.13.conv_block.6.bias", "model.14.conv_block.6.weight", "model.14.conv_block.6.bias", "model.15.conv_block.6.weight", "model.15.conv_block.6.bias", "model.16.conv_block.6.weight", "model.16.conv_block.6.bias", "model.17.conv_block.6.weight", "model.17.conv_block.6.bias", "model.18.conv_block.6.weight", "model.18.conv_block.6.bias". Unexpected key(s) in state_dict: "model.10.conv_block.5.weight", "model.10.conv_block.5.bias", "model.11.conv_block.5.weight", "model.11.conv_block.5.bias", "model.12.conv_block.5.weight" 该怎办
【科研笔记】《Semi-Supervised PR Virtual Staining for Breast Histopathological Images》
weixin_38171239: 你好，代码开源了吗？
【论文笔记】CycleGAN（基于PyTorch框架）
学AI的小然: 首先你要有人脸带口罩和不戴口罩的图片，可以不对应，训练后还要调参数
【论文笔记】CycleGAN（基于PyTorch框架）
学AI的小然: 写这篇论文的作者有自己训练好的模型

大家在看

ck-editor5的研究（2）：对 CKEditor5 进行设计，并封装成一个可用的 vue 组件 339

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

鲤鱼王的成长之路 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。