pytorch冻结网络参数及网络层学习率设置

本文介绍了两种深度学习网络优化策略。一是通过设置`requires_grad=False`来冻结部分网络层,避免其参数在训练中更新。二是采用分层学习率,对不同部分的网络分配不同的学习率,如在创建Adam优化器时,分别为基模块、生成器、判别器和特征学习层设置不同的学习率。这些技巧有助于提升模型训练的效果和效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、冻结网络层参数
参考:注意是requires_grad
https://zhuanlan.zhihu.com/p/357349586
https://zhuanlan.zhihu.com/p/65105409

 for name, param in model.named_parameters():
        if  ('discriminator_G' not in name) and ('discriminator_L' not in name):
            param.requires_grad = False

2.分层处理学习率
建立优化器的时候:

 	discriminator_L_param=list(map(id, model.backbone_2d.discriminator_L.parameters()))
    discriminator_G_param=list(map(id, model.backbone_2d.discriminator_G.parameters()))
    FL_param = list(map(id, model.backbone_2d.FL.parameters()))
    base_params = filter(lambda p: id(p) not in discriminator_L_param + discriminator_G_param+FL_param,model.parameters())

    if optim_cfg.OPTIMIZER == 'adam':
        optimizer = optim.Adam([
            {'params': base_params},
            {'params':model.backbone_2d.discriminator_G.parameters(),'lr':optim_cfg.LR*3},
            {'params':model.backbone_2d.discriminator_L.parameters(),'lr':optim_cfg.LR*3},
            {'params':model.backbone_2d.FL.parameters(),'lr':optim_cfg.LR*3}], 
            lr=optim_cfg.LR, weight_decay=optim_cfg.WEIGHT_DECAY)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值