StyleGAN-v2 ADA 的 pytorch 代码分析与实际使用_stylegan2-ada-pytorch-main-优快云博客

本文链接：https://blog.youkuaiyun.com/WinerChopin/article/details/113807034

这篇博客探讨了在数据有限的情况下训练生成对抗网络（GANs）的方法。文章详细介绍了计算损失、运行鉴别器、记录统计量以及动态更新数据增强策略的过程。具体包括：1) 通过鉴别器计算真实和伪样本的损失；2) 使用数据增强流水线；3) 记录损失和符号统计量；4) 累积统计信息；5) 应用ADA（Adaptive Data Augmentation）策略动态调整数据增强强度。此外，项目展示了PyTorch中多线程、多卡并行训练的实现，对类似任务的编程具有指导意义。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

$\rm Resources$

📋 $\rm Paper$ >> $\rm Training~Generative~Adversarial~Networks~with~Limited~Data$
💻 $\rm Codes$ >>tensorflow/pytorch
📰 $\rm Blogs$ >> $\rm 优快云:$ $\rm Training~Generative~Adversarial~Networks~with~Limited~Data$

$\rm Analysis$

$1 .$ 计算 $L_{adv}$ 时，前馈真实样本或伪样本给鉴别器 $D$ ;

## 对生成伪样本
fake_logits = self.run_D(fake_img, fake_c)
## 对真实训练样本
real_logits = self.run_D(real_img, real_c)

$2 .$ run_D 的具体细节为：

def run_D(self, img, c):
    ## 使用定义的含 p 的数据增强流水线作 aug
    img = self.augment_pipe(img) 
    logits = self.D(img, c)
    return logits

$3 .$ 记录 $L_{adv}$ 和 ${\mathbb E}[\rm sign (D_{train})]$ （这里使用的是 WGAN，所以 $L_{adv}$ 计算方式比较简单， $\min/\max$ ?_logits 即可）

training_stats.report('Loss/scores/real', real_logits)
training_stats.report('Loss/signs/real' , real_logits.sign()) ## 👈

$4 .$ 具体的，每一个被 $\rm reported$ 的状态（统计数据 $\rm statistic$ ）被记录了 3 个统计量：

## `elems` 是一个形参，这里考虑 tensor `logits`
moments = torch.stack([
    torch.ones_like(elems).sum(), ## 记录数量 (count)
    elems.sum(),                  ## 求和
    ## 计算 E[sign(D_train)] 只需要前两个统计量，即：moments[1]/moments[0]
    elems.square().sum(),
])

$5 .$ 累计前面 $4 .$ 记录的数据 moments of real_logits，累积（会使用到 _moments.add_(moments)） $N = 4$ 次迭代（ $\rm iter/minibatch$ ）
$6 .$ 通过获取 $\mathbb E[\rm sign(D_{train})]$ 来动态更新 p

# Execute ADA heuristic.
if (ada_stats is not None) and \ ## 是否使用 ADA 这一项技术
   (batch_idx % ada_interval == 0): ## N 值
    ada_stats.update()
    adjust = np.sign(ada_stats['Loss/signs/real'] - ada_target) \ ## ada_target 是 r_t 的阈值，文中设置是 0.6
                                                                  ## ada_stats['Loss/signs/real'] = moments_of_real_logits[1]/moments_of_real_logits[0]
             * (batch_size * ada_interval) / (ada_kimg * 1000)    ## 增益，the gain := (BxN)/SCALE, `B` is batch size, `N` is # of batches; all-in-all, it is FIXED.
    ## 更新 p 值
    augment_pipe.p.copy_((augment_pipe.p + adjust)\               ## D 偏强，则 adjust 为正，Aug 强度适当增大；D 偏弱，则 adjust 为负，Aug 强度适当减弱
                         .max(misc.constant(0, device=device)))   ## clip/truncate，限制概率在有效范围

$\rm Usage~of~AugPipe$

引用脚本文件 ./training/augment.py，直接初始化 nn.Module 模块——

import augment

aug_pipe = augment.AugmentPipe()
## input --type=torch.tensor --size=(N,C,H,W)
aug_input = aug_pipe(input)

$\rm BTW$ ，这个项目对于 pytorch 多线程、多卡并行训练编程有非常好的借鉴性，木奉👍！

StyleGAN-v2 ADA 的 pytorch 代码分析与实际使用

R e s o u r c e s \rm Resources Resources

A n a l y s i s \rm Analysis Analysis

U s a g e o f A u g P i p e \rm Usage~of~AugPipe Usage of AugPipe

$\rm Resources$

$\rm Analysis$

$\rm Usage~of~AugPipe$