MMDetection 设置某个模块下的所有权重都是不需要梯度怎么设置？

原创

已于 2024-12-18 08:32:49 修改 · 1.1k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #深度学习 #人工智能

于 2024-12-18 08:31:56 首次发布

在 MMDetection 中，如果需要设置某个模块下的所有权重不参与梯度计算，可以通过以下步骤实现。具体实现方式包括冻结参数以及确保这些参数不会被优化器更新。

方法 1：设置 `requires_grad=False`

这是最直接的方法，通过将模块中的所有参数的 requires_grad 属性设置为 False，使其在训练过程中不计算梯度。

代码示例：

# 冻结当前模块下的所有参数
for param in model.module_name.parameters():
    param.requires_grad = False

在 MMDetection 中，假设你有一个 teacher 模块需要冻结：

# 假设 model.teacher 是需要冻结的模块
for param in model.teacher.parameters():
    param.requires_grad = False

这样处理后：

该模块的权重在前向传播时不会参与梯度计算。
这些参数不会被优化器更新。

方法 2：过滤优化器的参数

通过调整优化器的参数列表，仅让需要计算梯度的参数参与优化。

代码示例：

# 过滤出需要计算梯度的参数
optimizer = torch.optim.Adam(
    filter(lambda p: p.requires_grad, model.parameters()), lr=1e-4
)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Joyner2018

关注关注

16
点赞
踩
6

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

实战技巧！AI应用架构师的数据安全AI防护体系设计实战技巧

AI智能探索者的博客

07-31

672

核心目标：满足监管要求，证明“我们的安全措施是有效的”。实战操作1：日志收集与分析用ELK Stack收集所有数据操作日志，并用Kibana可视化（比如“最近7天的异常访问次数”、“ Top 5 访问最多的用户”）。示例：用Logstash收集FastAPI日志input {tcp {output {用Kibana可视化日志：创建Dashboard，展示“每小时的访问次数”、“异常访问的IP分布”等指标。实战操作2：合规报告自动生成用Python脚本。

Pytorch的model.train() & model.eval() & torch.no_grad() & 为什么测试的时候不调用loss.backward()计算梯度还要关闭梯度

hxxjxw的博客

08-01

2880

使用PyTorch进行训练和测试时一定注意要把实例化的model指定train/eval model.train() 启用 BatchNormalization 和 Dropout model.eval() 不启用 BatchNormalization 和 Dropout 训练完train_datasets之后，model要来测试样本了。在model(test_datasets)之前，需要加上model.eval(). 否则的话，有输入数据，即使不训练，它也会改变权值。这是model...

2 条评论您还未登录，请先登录后发表或查看评论

深度学习训练时冻结部分参数的方法

shaojie_45的博客

11-04

4096

在使用mmdetection代码库时需要冻结部分网络参数，只训练一部分的网络。这里提供一种简单且不容易出现bug的方法，不仅仅适用于mmdetection代码库，也可以使用在其他的代码库里面，不过需要一定的改动。

baseline

Wood_Du的博客

03-23

803

服务器：驱动验证 nvidia-smi //截图快捷键 shift+ctrl+print 到粘贴板 cuda 验证 cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery sudo make ./deviceQuery 若有result=PASS，则CUDA安装成功。 NCCL 验证未验证 ...

MMdetection Finetune指南

qq_41627642的博客

01-19

319

【代码】MMdetection Finetune指南。

mmdetection冻结网络参数训练

Abo_luo的博客

04-14

5923

MMdetection针对模型backbone进行冻结参数训练问题问题解决可能存在问题总结问题原以为MMdetection针对模型backbone处进行参数冻结训练网上会有大量的教程，刚刚网上查了一下没找到，于是自己动手去发现解决以YOLOX模型为例，调用CSPDarknet时，定义了_freeze_stage方法，并在train方法中调用。self.frozen_stages默认为-1，即不会对模型进行参数冻结， 1、可以在定义CspDarknet类时，构造函数__init__中fro

MMdetection2.17版本配置文件全面解读、自定义backbone及多尺度训练

认真努力，做一只会飞的毛毛虫。

10-21

4214

配置文件结构在 config/_base _ 文件夹下有 4 个基本组件类型，分别是：数据集(dataset)，模型(model)，训练策略(schedule)和运行时的默认设置(default runtime)。许多方法，例如 Faster R-CNN、Mask R-CNN、Cascade R-CNN、RPN、SSD 能够很容易地构建出来。由 _base _ 下的组件组成的配置，被我们称为原始配置(primitive)。对于同一文件夹下的所有配置，推荐只有一个对应的原始配置文件。所有其他的配

MMDetection学习笔记（一）：训练与测试

博学而笃志，切问而近思。

08-24

3453

MMDetection学习笔记（一）：训练与测试

【AI视野·今日CV 计算机视觉论文速览第230期】Fri, 2 Jul 2021

TomRen

07-02

2696

AI视野·今日CS.CV 计算机视觉论文速览 Fri, 2 Jul 2021 Totally 69 papers ????上期速览✈更多精彩请移步主页 Daily Computer Vision Papers CSWin Transformer: A General Vision Transformer Backbone with Cross-Shaped Windows Authors Xiaoyi Dong, Jianmin Bao, Dongdong Chen, Weiming Zhang

【论文翻译】MobileHumanPose: Toward real-time 3D human pose estimation in mobiledevices

weixin_50862344的博客

03-11

559

在本文中，我们主要致力于建立一个轻量级的模型，并通过详细的实验来提高精度。我们声称轻量级骨干网在姿态估计任务中表现不佳。针对这一问题，我们提出了基于MoblieNetV2[38]的骨干网的改进版本。此外，与基线架构相比，我们采用跳跃式连接和参数激活函数来提高精度，同时保持成本效率。因此，我们构建了MobileHumanPose，这是可以在移动设备中实现的最精确和紧凑的模型。本文所实现的策略不仅局限于自顶向下和单阶段的方法，而且适用于各种类型的三维人体姿态估计。

动手学深度学习 PyTorch版李沐视频笔记

weixin_45729566的博客

08-06

664

04 数据操作+数据预处理。

pytorch中设置不要记录梯度传播信息的三种方式（torch.no_grad/@torch.no_grad/set_grad_enabled）

qq_43391414的博客

05-07

2902

这个东西和那个with torch.no_grad()一样的作用。

mmdetection的configs中的各项参数具体解释

热门推荐

hajlyx的博客

01-07

5万+

简介在使用mmdetection对模型进行调优的过程中总会遇到很多参数的问题，不知道参数在代码中是什么作用，会对训练产生怎样的影响，这里我以faster_rcnn_r50_fpn_1x.py和cascade_rcnn_r50_fpn_1x.py为例，简单介绍一下mmdetection中的各项参数含义 faster_rcnn_r50_fpn_1x.py 首先介绍一下这个配置文件所描述的框架，它是基...

MMDet逐行代码解读之ResNet50+FPN

wulele2的博客

02-13

1万+

文章目录前言1、ResNet501.1. 构建一个resnet501.2. 搭建过程1.2.1 stem部分1.2.2 ResLayer部分1.2.3 冻结部分参数1.2.4 重写train方法1.3. 前向传播2、FPN2.1.2.2.总结前言本篇是MMdet逐行解读第五篇。从本篇开始介绍mmdet/models文件夹内容。首先介绍最常用的resnet50+fpn结构。历史文章如下： AnchorGenerator解读 MaxIOUAssigner解读 DeltaXYWHBBoxCo

【mmdetection】参数解析

mjiansun的专栏

06-19

9165

图片输入大小解析 1.单尺度输入： train_pipeline = [ ...... dict( type='Resize', img_scale=(1333, 800), keep_ratio=True), ...... dict(type='Pad', size_divisor=32), ] 实际输入缩放计算方式： max_long_edge = max(img_scale) max_short_edge =

【干货】mmdetection使用coco格式的CrowdHuman数据集进行训练及测试（附调参过程）

Activewaste

07-10

1万+

注：从mmdetection使用coco数据集在faster rcnn训练和测试，到了解crowdhuman数据集标注格式，再到crowdhuman的标注格式转换成coco数据集标注格式，现在就到了最终目的了：训练转换后的Crowd Human数据集。以下是博主这一过程中整理的记录：【干货】用mmdetection，在COCO数据集上跑通faster R-CNN（测试、训练） COCO数据...

【pytorch】冻结、固定部分参数

zzy_pphz的博客

04-17

4421

我这里用resnet18举例，加入这一块代码即可。如果不知道你的神经网络模型中有哪些层，可以像我一样先print（model_ft）看看。比如我这里冻结了前1、2、3层，你也可以冻结其他的层。 print(model_ft) frozen_layers = [model_ft.layer1,model_ft.layer2,model_ft.layer3] for lay...

机器学习进阶＜5＞K-means智能客户分群与可视化分析系统

MMDetection 设置某个模块下的所有权重都是不需要梯度怎么设置？

方法 1：设置 requires_grad=False

代码示例：

方法 2：过滤优化器的参数

代码示例：

方法 1：设置 `requires_grad=False`