pytorch系列 ---9的番外， Xavier和kaiming是如何fan_in和fan_out的，_calculate_fan_in_and_fan_out解读 Conv2d

最新推荐文章于 2025-12-03 00:20:34 发布

原创

最新推荐文章于 2025-12-03 00:20:34 发布 · 5.6k 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#pytorch #weight_initialization

本文详细介绍了如何在PyTorch中计算线性层（Linear）和卷积层（Conv2d）的fan_in和fan_out。通过代码示例，解释了当权重张量维度为2时，对应线性层的fan_in等于输入通道数，fan_out等于输出通道数；而在卷积层中，fan_in和fan_out涉及卷积核大小，并通过计算权重张量特定维度的元素数量来确定。

本文主要借助代码讲解Xavier和kaiming是如何借助_calculate_fan_in_and_fan_out函数来计算当前网络层的fan_in（输入神经元个数）和fan_out（输出神经元个数的），先针对Linear和Conv2d两种。

在这里插入图片描述

m_c = nn.Conv2d(16, 33, 3, stride=2)
m_l = nn.Linear(1, 10)
m_c.weight.size()
m_l.weight.size()

out:

torch.Size([33, 16, 3, 3])
torch.Size([10, 1])

注意看Linear weight的维度为2，而Conv2d的维度为4.
首先判断tensor的维度，如果是二维，则是Linear，

if dimensions == 2:  # Linear
        fan_in = tensor.size(1)
        fan_out = tensor.size(0)

此时： $fan\_in = in\_channels$
$fan\_out = out\_channels$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。