模型冻结对应层参数freeze

目的

在做迁移学习或者自监督学习时,一般先预训练一个模型,再将该模型参数作为目标任务模型的初始化参数,或者直接freeze预训练模型,不再更新其参数。

方法

from collections.abc import Iterable
 
 
def set_freeze_by_names(model, layer_names, freeze=True):
    if not isinstance(layer_names, Iterable):
        layer_names = [layer_names]
    for name, child in model.named_children():
        if name not in layer_names:
            continue
        for param in child.parameters():
            #print(param.name)
            param.requires_grad = not freeze
 
 
def freeze_by_names(model, layer_names):
    set_freeze_by_names(model, layer_names, True)
 
 
def unfreeze_by_names(model, layer_names):
    set_freeze_by_names(model, layer_names, False)
 
 
def set_freeze_by_idxs(model, idxs, freeze=True):
    if not isinstance(idxs, Iterable):
        idxs = [idxs]
    num_child = len(list(model.children()))
    idxs = tuple(map(lambda idx: num_child + idx if idx < 0 else idx, idxs))
    for idx, child in enumerate(model.children()):
        if idx not in idxs:
            continue
        for param in child.parameters():
            param.requires_grad = not freeze
 
 
def freeze_by_idxs(model, idxs):
    set_freeze_by_idxs(model, idxs, True)
 
 
def unfreeze_by_idxs(model, idxs):
    set_freeze_by_idxs(model, idxs, False)

我的使用

# select params to freeze
        # print(all_model_list[:5])
for name, child in self.backbone.named_children():
	if name in all_model_list:
    	for param in child.parameters():
	        # print(param.name)
	        param.requires_grad = False

思路

  1. 读取整个模型
  2. 获取对应的子模型名字和child
  3. 将对应child参数冻结(child.parameters() 中param转化为 requires_grad = False)

参考资料

### 如何冻结YOLO模型以进行优化 #### 冻结操作的目的与意义 冻结YOLO模型中的部分参数可以有效地保持预训练模型的知识,防止这些参数更新影响最终模型性能。这种做法特别适用于迁移学习场景,在此过程中只微调特定而固定其余有助于提高新任务上的表现[^1]。 #### 实现冻结的具体方法 对于YOLOv8而言,可以通过设置`requires_grad=False`属性来实现对指定网络参数梯度计算过程中的忽略,从而达到冻结的效果。下面给出一段Python代码用于展示如何具体实施这一操作: ```python import torch.nn as nn def freeze_layers(model, layer_names): for name, param in model.named_parameters(): if any(layer_name in name for layer_name in layer_names): param.requires_grad_(False) # 假设model为已经加载好的YOLOv8实例对象 freeze_layers(model, ['backbone', 'neck']) ``` 上述函数接受两个参数:一个是待处理的目标神经网络模块;另一个是由字符串组成的列表,表示想要被冻结住的那一组或几组特征提取组件的名字(比如这里的'backbone','neck')。通过遍历整个模型内部所有的可训练变量,并依据给定条件判断是否应该将其对应的求导标记置位成假(`False`)即可完成相应工作[^3]。 #### 数据集适应性调整 当采用这种方式来进行优化时,通常会先利用大规模通用物体识别数据集上预先训练得到的一个较为成熟的版本作为起点,之后再针对具体的下游应用场景做适当修改——这不仅能够加快收敛速度而且还能获得更好的泛化能力。例如,在文献中提到的研究里就曾运用基于ResNet50V2架构构建而成的新颖方案实现了对面部遮挡物存在与否的有效判别,取得了不错的成果[^2]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值