定义一个可学习的参数,并初始化

本文介绍了一个自定义的PyTorch模块NewMatrices,该模块用于特定形状的矩阵运算,强调了初始化的重要性,并详细解释了其工作原理,包括权重和偏置的初始化策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一定不要忘记初始化,否则可能会出错!!!

class NewMatrices(nn.Module):#[16, 1, 400]-->batch_size必须是16,若不满足,则丢弃
    def __init__(self, batch_size, input_dim, output_dim, bias_dim=128, dropout=0.1):
        super(NewMatrices, self).__init__()
        # self.dropout = nn.Dropout(dropout)
        self.weight = nn.Parameter(torch.Tensor(batch_size, input_dim, output_dim))
        self.bias = nn.Parameter(torch.Tensor(bias_dim))
        self.reset_parameters()
    def reset_parameters(self):
        torch.nn.init.kaiming_uniform_(self.weight, a=math.sqrt(5))
        if self.bias is not None:
            fan_in, _ = torch.nn.init._calculate_fan_in_and_fan_out(self.weight)
            bound = 1 / math.sqrt(fan_in)
            torch.nn.init.uniform_(self.bias, -bound, bound)
    def forward(self, x):
        # x = self.dropout(x)
        return torch.bmm(self.weight, x)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值