torch module.apply(fn)说明

原创

已于 2022-03-22 10:26:33 修改 · 987 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #计算机视觉

于 2022-03-22 10:21:20 首次发布

本文介绍了如何在PyTorch中使用nn.Module及其子类，并详细讲解了如何定义weight_init函数来初始化子模块的权重，以及如何通过apply()方法递归地应用该函数。通过实例展示，读者将学会如何正确地对神经网络模型进行权重初始化。

应用的对象应是nn.Module类型或者它的继承类。
可以有children。

比如

class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

蓝羽飞鸟

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

NotImplementedError: Cannot copy out of meta tensor； no data! Please use torch.nn.Module.to_empty()

沉迷单车的追风少年

12-25

1587

使用huggingface transformers/diffusion from_pretrained() 时报错，二次开发模型的时候报错。这是因为在用预训练模型进行二次开发的时候，自己新增了一些模块。

torch.nn.Module所有方法总结及其使用举例

敲代码的小风

01-16

7917

参考链接: class torch.nn.Module 原文以及翻译: 在这里插入代码片代码实验: 在这里插入代码片

参与评论您还未登录，请先登录后发表或查看评论

torch.nn.Module.apply(fn)

敲代码的小风

01-16

7558

参考链接: torch.nn.Module.apply(fn)

（原）torch的apply函数

weixin_34186931的博客

12-26

1790

转载请注明出处： http://www.cnblogs.com/darkknightzh/p/6221633.html torch中的apply函数通过可以不断遍历model的各个模块。实际上其使用的是深度优先算法。其具体代码如下所示（代码见torch/install/share/lua/5.1/nn/Module.lua）： -- Run a callback (called...

Pytorch：torch.nn.Module.apply用法详解

weixin_42046845的博客

01-08

1771

`torch.nn.Module.apply` 是 PyTorch 中用于递归地应用函数到模型的所有子模块的方法。它允许对模型中的每个子模块进行操作，比如初始化权重、改变参数类型等

Pytorch apply() 函数

hxxjxw的博客

08-16

1万+

apply 函数是nn.Module 中实现的, 递归地调用self.children() 去处理自己以及子模块我们知道pytorch的任何网络net，都是torch.nn.Module的子类,都算是module, 也就是模块。 pytorch中的model.apply(fn)会递归地将函数fn应用到父模块的每个子模块submodule，也包括model这个父模块自身。经常用于初始化init_weights的操作 ......

PyTorch 中的 apply [autograd.Function]

撒旦先生的博客

03-03

2906

源码: 是 PyTorch 中用于存储子模块的容器，而方法可以应用一个函数到 ModuleList 中的每个子模块。具体来说，方法会递归地将指定的函数应用到 ModuleList 中的每个子模块以及每个子模块的子模块上。这个方法的语法如下：其中是要应用的函数，它接受一个参数并且没有返回值。在 apply() 方法被调用后，会遍历 ModuleList 中的每个子模块，并把这个函数应用到每个子模块上。例如，假设有一个 ModuleList 包含了若干线性层（Linear），我们想要初始化所有

深入探讨PyTorch中的model.apply()方法：初始化神经网络权值的利器

AI_dataloads的博客

11-09

2834

通过方法，我们可以更加好地对整个神经网络进行操作，特别是在初始化权值的场景下。这一方法不仅使代码结构更清晰，而且提高了代码的灵活性和可维护性。希望本文对读者理解并应用提供了一些帮助。如果有任何疑问或建议，欢迎在评论区留言。

每天学点pytorch--torch.nn.Module的apply()方法

qiumokucao的博客

11-16

8903

官方连接： Module — PyTorch 1.10.0 documentation apply(fn)的官网介绍，该方法会将fn递归的应用于模块的每一个子模块（.children()的结果）及其自身。典型的用法是，对一个model的参数进行初始化。示例： import torch import torch.nn as nn @torch.no_grad() def init_weights(m): print(m) if type(m) == nn.Linear:

pytorch系列10 --- 如何自定义参数初始化方式，apply()

热门推荐

墨流觞的博客

11-12

4万+

本文主要内容：单层网络初始化多层网络初始化使用apply和weight_init函数在__init__函数使用self.modules()初始化 1.单层网络在创建model后直接调用torch.nn.innit里的初始化函数 layer1 = torch.nn.Linear(10,20) torch.nn.init.xavier_uniform_(layer1.weigh...

Torch7 - Tensor

人工智能

03-16

8531

The Tensor class is probably the most important class in Torch. Almost every package depends on this class. It is theclass for handling numeric data. As with pretty much anything in Torch7, tensor

apply方法

Andypan的智慧书屋

09-26

490

1.1.1. apply方法通常我们会在类的伴生对象中定义apply方法，当遇到类名(参数1,...参数n)时apply方法会被调用 object ApplyDemo { def main(args: Array[String]) { //调用了Array伴生对象的apply方法 //def apply(x: Int, xs: Int*):

【整理】pytorch参数初始化两种方法

qq_42995479的博客

10-03

4569

pytorch在定义模型时有默认的参数初始化，有时候我们需要自定义参数的初始化，就需要用到torch.nn.init。具体的不同初始化，可以查看pytorch官方文档 torch.nn.init - PyTorch 1.6.0 documentationpytorch.org/docs/stable/nn.init.html?highlight=init 方法一： 1，先定义初始化模型方法; 2，运用apply(). class Net(nn.Module): de

手把手教你配置torch环境

qq_40859802的博客

10-15

5980

项目背景：环境包：cuda版本的torch、torchvision、opencv 系统环境：win10 X64，anaconda（配置好系统环境，百度一堆教程）配置过程 1、添加源路径在配置环境之前我们先添加其他源路径（如果不添加，会默认从官方源路径进行下载，速度很慢） #打开终端cmd #进入base环境 conda activate base #中科大源 conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/ma

model.apply(fn)或net.apply(fn)

qq_37025073的博客

06-13

2万+

首先，我们知道pytorch的任何网络net，都是torch.nn.Module的子类,都算是module，也就是模块。 pytorch中的model.apply(fn)会递归地将函数fn应用到父模块的每个子模块submodule，也包括model这个父模块自身。比如下面的网络例子中。net这个模块有两个子模块，分别为Linear(2,4)和Linear(4,8)。函数首先对Linear(2,4)和Linear(4,8)两个子模块调用init_weights函数，即print(m)打印Linear(2,4

【PyTorch】torch.nn.Module 源码分析(转)

lishuiwang的专栏

02-25

2674

torch.nn.Module这个类的内部有多达 48 个函数，这个类是PyTorch中所有neural network module的基类，自己创建的网络模型都是这个类的子类，下边是一个示例。这篇文章就和大家一起来阅读一下这个base class。 import torch.nn as nn import torch.nn.functional as F class Mode...

ubuntu常见问题（持续更新）

一念天堂

11-09

2023

ubuntu

TypeError Traceback (most recent call last) /tmp/ipykernel_127143/1660473424.py in <module> 8 nn.init.uniform_(m.weight, std=0.01) 9 ---> 10 net.apply(init_weights); ~/anaconda3/envs/nn/lib/python3.7/site-packages/torch/nn/modules/module.py in apply(self, fn) 657 """ 658 for module in self.children(): --> 659 module.apply(fn) 660 fn(self) 661 return self ~/anaconda3/envs/nn/lib/python3.7/site-packages/torch/nn/modules/module.py in apply(self, fn) 658 for module in self.children(): 659 module.apply(fn) --> 660 fn(self) 661 return self 662 /tmp/ipykernel_127143/1660473424.py in init_weights(m) 6 def init_weights(m): 7 if type(m) == nn.Linear: ----> 8 nn.init.uniform_(m.weight, std=0.01) 9 10 net.apply(init_weights); TypeError: uniform_() got an unexpected keyword argument 'std'

最新发布

05-10

<think>好的，我现在需要解决用户在PyTorch中使用`nn.init.uniform_`时遇到的TypeError错误，具体是出现了意外的关键字参数'std'。首先，我得确认用户的问题具体是什么情况。用户提到错误是`TypeError: __init__() got an unexpected keyword argument 'std'`，这通常是因为函数调用时传入了它不支持的参数。接下来，我需要回忆`nn.init.uniform_`函数的正确用法。根据PyTorch的文档，`nn.init.uniform_`的函数签名是`torch.nn.init.uniform_(tensor, a=0.0, b=1.0)`，其中`a`和`b`是均匀分布的下界和上界。这意味着这个函数确实不支持`std`参数。可能用户混淆了不同的初始化方法，比如`normal_`，它使用均值和标准差。用户可能原本想使用正态分布初始化，但错误地调用了`uniform_`并传入了`std`参数。这时候需要检查代码中是否有这样的错误调用。另外，也有可能用户参考了某些旧版本的教程或代码，而PyTorch的API在新版本中发生了变化。不过根据当前版本的文档，`uniform_`一直没有`std`参数，所以更可能是用户的代码错误。解决方案应该是让用户检查调用`uniform_`的地方，将`std`参数替换为正确的参数。例如，如果用户想使用均匀分布，应该用`a`和`b`；如果想用正态分布，应该换成`init.normal_`并指定`mean`和`std`。同时，用户可能需要了解不同初始化方法的应用场景。比如，均匀分布适合在某个范围内均匀初始化参数，而正态分布则根据均值和标准差来初始化，适用于不同的神经网络层。还需要考虑用户是否有其他潜在的代码错误，比如拼写错误或者参数传递错误。建议用户提供具体的代码片段，以便更准确地诊断问题。此外，检查PyTorch的版本是否过时，虽然可能性较低，但也不排除版本差异导致的问题。最后，生成相关问题可以帮助用户更深入地理解参数初始化的方法，避免类似的错误。例如，询问如何正确使用其他初始化函数，或者如何选择合适的初始化参数等。</think>### PyTorch中nn.init.uniform_函数的TypeError错误解决方案在PyTorch中使用`nn.init.uniform_`函数时出现`TypeError: __init__() got an unexpected keyword argument 'std'`，通常是因为**参数名称或初始化方法选择错误**。以下是逐步分析和解决方案： --- #### 错误原因分析 1. **函数参数不匹配**： `nn.init.uniform_`的函数定义为： $$torch.nn.init.uniform_(tensor, a=0.0, b=1.0)$$ 它仅接受`a`（均匀分布下界）和`b`（上界）参数，**不支持`std`参数**。 **错误示例**：`nn.init.uniform_(weight, std=0.01)` [^1]。 2. **混淆初始化方法**： `std`是正态分布初始化（`nn.init.normal_`）的参数，若需使用正态分布，应调用`normal_`而非`uniform_`。 --- #### 解决方案根据需求选择以下两种修复方式之一： 1. **使用均匀分布初始化（正确参数）** 若目标是均匀分布初始化，需指定`a`和`b`： ```python import torch.nn as nn weight = nn.Parameter(torch.Tensor(10, 5)) nn.init.uniform_(weight, a=-0.1, b=0.1) # 在[-0.1, 0.1]范围内均匀初始化 ``` 2. **改用正态分布初始化** 若需要基于标准差（`std`）初始化，应使用`nn.init.normal_`： ```python nn.init.normal_(weight, mean=0.0, std=0.01) # 均值为0，标准差为0.01的正态分布 ``` --- #### 参数初始化方法对比 | 方法 | 用途 | 关键参数 | |----------------|--------------------------|----------------| | `uniform_` | 均匀分布初始化 | `a`, `b` | | `normal_` | 正态分布初始化 | `mean`, `std` | | `xavier_uniform_` | Xavier均匀初始化（适用于全连接层） | `gain` | | `kaiming_normal_` | Kaiming正态初始化（适用于卷积层） | `mode`, `nonlinearity` | --- #### 扩展建议 - **检查文档版本**：PyTorch API可能随版本更新变化，建议查阅[官方文档](https://pytorch.org/docs/stable/nn.init.html)确认参数。 - **代码审查**：检查是否有其他类似参数错误（如`var`、`scale`等非法参数）。 - **初始化策略**：根据网络层类型选择合适初始化方法（如Xavier初始化常用于全连接层，Kaiming初始化用于卷积层）[^2]。 ---