- 博客(2)
- 收藏
- 关注
原创 pytorch学习笔记-循环神经网络
x:shape是(sequence_length,input_size)或(sequence_length, batch_size,input_size)或者(batch_size,sequence_length,input_szie)的张量,上述三种形式分别对应的情况是:x是一条单一数据;ct:shape是(D*num_layers, hidden_size)或者(D*numlayers, batch_size, hidden_size)循环神经网络中的每一个时间步的网络参数都是一样的。
2024-06-19 09:45:32
263
原创 pytorch学习笔记3-卷积神经网络
model.eval()用于训练和验证状态的切换,只会影响dropout和batchnorm的行为,不会影响梯度计算,但是在验证模式下,不会进行梯度的反向传播(torch.no_grad()用于停止autograd模块的工作,停止所有的梯度计算,但是不会影响dropout层和batch norm层的行为。BatchNorm过程是对每个通道独立进行的。不是只有反向传播才有梯度计算吗?4、print的格式化输出。
2024-06-18 15:00:20
201
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人