代码解析—part3 训练ADM—CVPR2023—Implicit Identity Leakage: The Stumbling Block to Improving Deepfake

最新推荐文章于 2025-12-19 10:49:24 发布

原创

最新推荐文章于 2025-12-19 10:49:24 发布 · 1.1k 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#AIGC #视觉检测 #人工智能 #论文阅读 #分类

论文讲解请看：https://blog.youkuaiyun.com/JustWantToLearn/article/details/138758033
代码链接：https://github.com/megvii-research/CADDM
在这里，我们简要描述算法流程，着重分析模型搭建细节，以及为什么要这样搭建。
part 1：数据集准备，请看链接 https://blog.youkuaiyun.com/JustWantToLearn/article/details/138773005
part 2: 数据集加载，包含 Multi-scale Facial Swap(MFS) 模块：https://blog.youkuaiyun.com/JustWantToLearn/article/details/139092687
part 3：训练过程，ADM模块，本文

1、训练 train.py

python train.py --cfg ./configs/caddm_train.cfg


def train():
    args = args_func()

    # load conifigs
    cfg = load_config(args.cfg)

    # init model. 模型初始化
    net = model.get(backbone=cfg['model']['backbone'])
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
    net = net.to(device)
    net = nn.DataParallel(net)

    # loss init loss初始化，多任务损失函数 MultiBoxLoss 和交叉熵损失函数 nn.CrossEntropyLoss
    det_criterion = MultiBoxLoss(
        cfg['det_loss']['num_classes'],
        cfg['det_loss']['overlap_thresh'],
        cfg['det_loss']['prior_for_matching'],
        cfg['det_loss']['bkg_label'],
        cfg['det_loss']['neg_mining'],
        cfg['det_loss']['neg_pos'],
        cfg['det_loss']['neg_overlap'],
        cfg['det_loss']['encode_target'],
        cfg['det_loss']['use_gpu']
    )
    criterion = nn.CrossEntropyLoss()

    # optimizer init.
    optimizer = optim.AdamW(net.parameters(), lr=1e-3, weight_decay=4e-3)

    # load checkpoint if given
    base_epoch = 0
    if args.ckpt:
        net, optimzer, base_epoch = load_checkpoint(args.ckpt, net, optimizer, device)

    # get training data 加载训练数据集
    print(f"Load deepfake dataset from {
     
     cfg['dataset']['img_path']}..")
    train_dataset = DeepfakeDataset('train', cfg)
    train_loader = DataLoader(train_dataset,
                              batch_size=cfg['train']['batch_size'],
                              shuffle=True, num_workers=4,
                              collate_fn=my_collate
                              )

    # start trining.进入训练模式，并循环遍历每个epoch和batch。在每个epoch开始时更新学习率
    net.train()
    for epoch in range(base_epoch, cfg['train']['epoch_num']):
        for index, (batch_data, batch_labels) in enumerate(train_loader):

            lr = update_learning_rate(epoch)
            for param_group in optimizer.param_groups:
                param_group['lr'] = lr

            labels, location_labels, confidence_labels = batch_labels
            labels = labels.long().to(device)
            location_labels = location_labels.to(device)
            confidence_labels = confidence_labels.long().to(device)
            #计算分类损失和检测损失。然后计算总损失，并执行反向传播
            optimizer.zero_grad()
            locations, confidence, outputs = net(batch_data)
            loss_end_cls = criterion(outputs, labels)
            loss_l, loss_c = det_criterion(
                (locations, confidence),
                confidence_labels, location_labels
            )
            acc = sum(outputs.max(-1).indices == labels).item() / labels.shape[0]
            det_loss = 0.1 * (loss_l + loss_c)
            loss = det_loss + loss_end_cls
            loss.backward()
            # 梯度裁剪和优化器步
            torch.nn.utils.clip_grad_value_(net.parameters(), 2)
            optimizer.step()

            outputs = [
                "e:{},iter: {}".format(epoch, index),
                "acc: {:.2f}".format(acc),

最低0.47元/天解锁文章

5 条评论

c中需要菜鸟 2024.06.04
你好，在windows系统上对于_jpegpy.cc文件，无法引入这个模块，如何解决呢
- 羁.217回复清风素衣月初凉 2025.03.15
  github的issues有人提供了解决方案，可以参考
- c中需要菜鸟回复清风素衣月初凉 2024.09.08
  没有[face]emoji:010.png[/face]
- 清风素衣月初凉回复c中需要菜鸟 2024.06.19
  你好，我也遇到了这个问题，请问你解决了嘛

优快云-Ada助手 2024.05.25
恭喜作者第12篇博客的发布！内容涉及代码解析和训练ADM，探讨了CVPR2023的主题“Implicit Identity Leakage: The Stumbling Block to Improving Deepfake”。这是一个非常有趣和深入的主题，我期待能够看到更多关于这个领域的分享。建议作者在下一篇博客中可以进一步探讨如何应对Implicit Identity Leakage对深度伪造技术的影响，或者分享一些实践经验和案例分析。希望作者能够继续保持创作热情，为读者带来更多有价值的内容！