使用CycleGAN训练自己制作的数据集,通俗教程,快速上手(详细图文教程)

在这里插入图片描述

💪 专业从事且热爱图像处理,图像处理专栏更新如下👇:
📝《图像去噪》
📝《超分辨率重建》
📝《语义分割》
📝《风格迁移》
📝《目标检测》
📝《暗光增强》
📝《模型优化》
📝《模型实战部署》
📝《图像配准融合》
📝《数据集》
📝《高效助手》


在这里插入图片描述

总结了使用CycleGAN训练自己制作的数据集,这里的教程例子主要就是官网给出的斑马变马,马变斑马,两个不同域之间的相互转换。教程中提供了官网给的源码包和我自己调试优化好的源码包,大家根据自己的情况下载使用,推荐学习者下载我提供的源码包,可以少走一些弯路,按照我的教程,能较快上手训练使用。

一、源码包的下载

官方给出的源码包下载链接:CycleGAN官网

在这里插入图片描述

配套教程源码包获取文章末扫码到公众号「视觉研坊」中回复关键字:CycleGAN,会自动回复下载链接。

下载好配套教程的源码包解压后的样纸见下:

在这里插入图片描述
:如果是下载官网提供源码包的童鞋,在下载后的根目录中创建两个文件,分别是:checkpoints文件(用于存放训练好的模型权重文件)和results文件(用于存放测试后结果)。

二、安装训练必要的库文件

Python的版本选用3.7或者3.8都可以。

在这里插入图片描述

三、准备数据集

准备数据集
数据集可以是自己准备的,也可以下载官网提供的,下载官网提供的数据集链接为:数据集下载,如下面的样纸,打开链接后直接点击即可下载数据集,在我提供的源码包中,我已经下载了horse2zebra.zip,后面的教程也都是基于此数据集讲解的。

在这里插入图片描述

下载解压后将文件复制到根目录datasets文件中,如下:

在这里插入图片描述

训练集里面的样纸见下,如果是用自己数据集的童鞋,将两个不同域的图像,分别复制到对应的测试集里面和训练集里面。

在这里插入图片描述

下面是补充解释上面对应的A域,B域各对应着的类别:

在这里插入图片描述

四、训练数据集

4.1 配置训练文件

在正式训练前,需要在编译软件中配置训练文件,我这里提供的配置方法是在Pycharm编译软件中,其它编译软件的配置方法也类似,具体配置方法见下:

(1)先运行一下train.py文件,这时候会报错提示,提示需要配置训练文件,如下:

在这里插入图片描述

报错的提示如下:error: the following arguments are required: --dataroot

在这里插入图片描述

(2)打开Run的下拉菜单,点击Edit Configurations,如下:

在这里插入图片描述
在这里插入图片描述

如上图所示,在打开的编辑框中输入如下命令后点击OK即可添加好训练配置文件:

在这里插入图片描述

4.2 训练参数的修改

下面的参数童鞋根据自己的电脑配置自行修改

(1)训练轮数epoch,修改位置见下:

在这里插入图片描述

(2) 一次喂入图片数量,即batch_size的修改,由于CycleGAN网络特别复杂,训练占用的显存特别大,电脑配置一般的话建议改为1就可以,如果你的电脑显存为8G,参数改为2,见下:

在这里插入图片描述

下图是我自己电脑显存的使用情况,我电脑显存为8G,batch_size参数为2,大家参考我的电脑配置自行修改训练参数:

在这里插入图片描述

4.3 开始训练

上面步骤都准备好后在Terminal控制台中输入下面命令回车就开始训练了,如下:

python train.py --dataroot ./datasets/horse2zebra --name horse2zebra_cyclegan --model cycle_gan

在这里插入图片描述

回车后下面这种样纸的情况,就说明在正常训练了:

在这里插入图片描述

4.4 可视化训练过程

使用visdom可视化训练过程。安装好visdom这个库后,进入到库所在的文件夹中,打开文件server.py文件,注释一行里面的代码,防止每次打开visdom时都自动连外网更新,见下:

在这里插入图片描述

在这里插入图片描述

4.4.1 启动visdom

先进入虚拟环境中,输入下面命令后,复制输出的网址到浏览器中就可以实时观看CycleGAN网络的预测结果了,也可以实时看到loss值的变换情况,见下:

python -m visdom.server

在这里插入图片描述

在这里插入图片描述

4.4.2 修改visdom端口号

上面使用命令python -m visdom.server直接启动visdom时,默认端口号都为8097,一直使用这个端口号有时会出现端口冲突的问题,我们可以自定义端口号显示,自定义端口号为8098的例子见下:

python -m visdom.server -p 8098

五、测试训练好的模型

5.1 配置测试文件

上面的训练很漫长,等待全部训练完后就可以开始测试训练好的模型了,上面训练好的模型,存放在根目录文件夹checkpoints中,如下:

在这里插入图片描述

同样类似上面的方法,配置测试文件,先运行以下test.py文件,同样也会报错提示,如下:

在这里插入图片描述

在这里插入图片描述

开始配置测试文件:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

复制权重文件到新建的文件夹horse2zebra_pretrained中,并将复制过来的权重文件名字改为latest_net_G.pth,如下:

在这里插入图片描述

5.2 开始测试

Terminal控制台中输入以下命令,并回车就开始测试了,如下:

python test.py --dataroot datasets/horse2zebra/testA --name horse2zebra_pretrained --model test --no_dropout

在这里插入图片描述

出现下面的样纸时就说明测试完成了,测试的最后结果会保存到根目录下的results这个文件夹中,见下:

在这里插入图片描述

在这里插入图片描述

以上就是使用CycleGAN网络训练自己数据集,并测试最终模型的过程。

六、测试官方给出的模型权重

当然有的童鞋懒得训练也可以使用官方已经训练好的模型权重文件,下载官方给的模型权重文件链接为:官网提供的模型权重,如下:

在这里插入图片描述

直接点击下载好后复制到根目录下的checkpoints文件下,新建一个文件夹,再将权重文件复制进去新建的文件夹中,如下:

在这里插入图片描述

最后测试之前先修改test.py的配置文件,具体操作同上,如下:

在这里插入图片描述

在这里插入图片描述

最后在Terminal控制台中输入以下命令回车后,即可测试模型权重的训练结果,最后测试的图像结果保存位置也是在根目录下的results文件夹中,见下:

python test.py --dataroot datasets/horse2zebra/testA --name horse2zebra.pth_pretrained --model test --no_dropout

在这里插入图片描述

在这里插入图片描述

七、总结

以上就是使用CycleGAN训练自己制作的数据集,快速上手的通俗教程,博文中也提供了直接下载官方提供模型权重文件的使用方法,希望我总结的教程能帮到你快速上手使用。

感谢您阅读到最后!😊总结不易,多多支持呀🌹 点赞👍收藏⭐评论✍️,您的三连是我持续更新的动力💖

关注公众号「视觉研坊」,获取干货教程、实战案例、技术解答、行业资讯!

### 使用自定义数据集训练CycleGAN模型 #### 数据准备与预处理 为了使自定义的数据能够被CycleGAN模型所利用,需遵循特定的文件夹结构并执行必要的预处理操作。依据给定的信息,在`single_dataset.py`中实现了一个专门用于加载单一路径下图片集合的数据集类[^1]。然而,对于完整的CycleGAN训练而言,通常需要两个不同域的图像作为输入。 在构建适合于CycleGAN框架下的数据集之前,应该先按照如下方式整理好原始素材: - 创建名为A和B的子目录分别存储来自源领域(如马)的目标领域(如斑马)样本; - 确保每个类别内部的所有实例都具有相同的尺寸规格;如果存在差异,则可通过裁剪或填充来统一大小; - 对所有待使用的视觉材料实施标准化流程——这可能涉及到色彩空间转换、亮度对比度调整等方面的工作[^3]。 完成上述准备工作之后,可借助Python库PIL/Pillow读取这些静态资源,并将其转化为NumPy数组形式以便后续处理。此外,还应当注意审查整个批次内的统计特性是否存在偏差现象,及时剔除那些明显偏离正常范围之外的对象以维持整体质量稳定。 #### 配置参数设定 当准备好高质量的数据后,下一步就是定制化实验环境中的各项超参了。考虑到官方给出的例子已经涵盖了大部分常用选项,这里仅列举几个较为重要的条目供参考者自行修改适应具体应用场景的需求: - `--dataroot`: 定义本地磁盘上存放着配对好的AB两类实体的具体位置; - `--name`: 给本次运行指派独一无二的名字标签方便日后检索查看日志记录; - `--model cycle_gan`: 明确指出采用的是哪一个具体的网络架构版本; - `--no_dropout`(默认开启): 控制是否应用Dropout机制防止过拟合情况发生; - `--lambda_A`, `--lambda_B`: 调节对抗损失项前系数权重影响最终效果呈现风格倾向性[^2]。 除了以上提到的内容外,还有许多其他潜在可控变量等待探索发现,比如批量规模(`batch_size`)、迭代次数(`n_epochs`)等都会不同程度地作用到收敛速度乃至泛化能力之上。 #### 常见问题解决方案 在整个开发周期内难免会遇到各式各样的挑战难题,下面罗列了一些普遍存在的状况及其对应的应对策略: - **内存溢出错误**:尝试减少每轮次参与计算的数量级或是启用梯度累积技术分摊压力; - **生成结果缺乏多样性**:适当增加噪声扰动程度促进探索未知解空间的可能性; - **跨平台移植困难**:确保依赖包版本一致性和硬件加速驱动程序安装无误; - **性能瓶颈难以突破**:考虑引入混合精度运算(Mixed Precision Training)提高吞吐量效率。 ```bash python train.py \ --dataroot ./datasets/horse2zebra \ --name horse2zebra_cyclegan \ --model cycle_gan \ --no_dropout \ --lambda_A 10.0 \ --lambda_B 10.0 ```
评论 498
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

视觉研坊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值