基于标签信息生成图像及InfoGAN模型介绍
1. 基于MNIST数据集的图像生成
在图像生成任务中,我们可以基于标签信息来生成图像。以下是一些关键参数设置:
| 参数 | 类型 | 值 |
| ---- | ---- | ---- |
| classes | int | 10 |
| img_size | int | 64 |
| channels | int | 1 |
| log_interval | int | 100 |
| seed | int | 1 |
在GTX 1080Ti显卡上训练200个epoch大约需要22分钟,占用约729 MB的GPU内存。从MNIST数据集生成的图像随着训练的进行质量逐渐提升。在训练初期,生成的图像在垂直和水平方向上难以达到平滑效果,训练25个epoch后生成的图像容易出现斑点噪声,但经过200个epoch后,图像质量有了显著改善。
2. 使用Fashion - MNIST数据集
MNIST数据集由大量手写数字组成,是机器学习社区的事实标准,常被用于验证流程。而Fashion - MNIST数据集则是一个更好的替代选择,它由60,000张图像和标签的训练集以及10,000张图像和标签的测试集组成。所有图像均为灰度图,尺寸为28x28像素,包含10个图像类别,分别是:T恤/上衣、裤子、套头衫、连衣裙、外套、凉鞋、衬衫、运动鞋、包和踝靴。
使用该数据集的操作步骤如下:
1. 复制 main.py 文件为 fashion-main.py ,以保留原始文件。 <
超级会员免费看
订阅专栏 解锁全文

1811

被折叠的 条评论
为什么被折叠?



