PyTorch实现感知判别器图像操纵的教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00212/article/details/146529576

PyTorch实现感知判别器图像操纵的教程

PerceptualGAN Pytorch implementation of Image Manipulation with Perceptual Discriminators paper 项目地址: https://gitcode.com/gh_mirrors/pe/PerceptualGAN

1. 项目介绍

本项目是基于论文《Image Manipulation with Perceptual Discriminators》的PyTorch实现。该论文提出了一种使用感知判别器的图像操纵方法，通过训练生成对抗网络（GAN）来实现图像的转换和增强。本项目由Diana Sungatullina、Egor Zakharov、Dmitry Ulyanov和Victor Lempitsky共同开发，并在2018年的欧洲计算机视觉会议上发表。

2. 项目快速启动

克隆仓库

首先，您需要克隆这个仓库到本地环境：

git clone https://github.com/egorzakharov/PerceptualGAN.git
cd PerceptualGAN/

安装依赖

确保您的环境中安装了以下依赖项：

Python 3.5+
PyTorch 0.4.0
TensorFlow 1.3+（用于tensorboard）

下载数据集

请遵循官方仓库的指南下载所需的数据集：

Celeba-HQ
monet2photo
apple2orange

设置Tensorboard

所有训练数据和中间结果将通过tensorboard展示。按照官方仓库中的安装说明设置完成后，使用以下命令启动tensorboard：

tensorboard --logdir runs

训练模型

以下是一些示例用法：

./scripts/celebahq_256p_pretrain.sh
./scripts/celebahq_256p_smile.sh

为了获得最佳质量的结果，您需要首先将网络作为自动编码器进行预训练。请使用带有pretrain后缀的脚本来完成相应数据集的预训练。预训练完成后，您可以启动主要的训练脚本。

在脚本中，您需要设置以下选项：

images_path：对于Celeba-HQ，这应该指向包含图像的文件夹。
train/test_img_A/B_path：应该指向包含图像名称的txt列表或图像文件夹（CycleGAN）。
pretrained_gen_path：预训练完成后，应指向包含latest_gen_B.pkl文件的文件夹。

测试模型

为了测试，您需要运行以下命令，并设置input_path到包含图像的文件夹（可选地，设置img_list到一个包含这些图像名称的子集列表），指定image_size进行缩放（对于CelebA-HQ是必需的），网络权重的文件（net_path）和输出目录（output_path）。

python test.py --input_path data/celeba_hq --img_list data/lists_hq/smile_test.txt --image_size 256 \
--net_path runs/celebahq_256p_smile/checkpoints/latest_gen_B.pkl --output_path results/smile_test