pytroch学习笔记(1)

本文介绍了Dropout作为一种常用的深度学习正则化方法,通过在训练时随机关闭部分神经元以减少过拟合。它通常位于隐藏层之间,如PyTorch示例中全连接层fc1和fc2之间,以提升模型的泛化能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

nn.Dropout

官方定义

Dropout是一种常用的正则化方法,通过随机将部分神经元的输出置为0来减少过拟合。

Dropout在训练时随机讲某些张量的值设为0,从而减少模型对训练数据的依赖程序,提高泛化能力;同时在测试时需要关闭Dropout,具体来说,如果处于model.eval模式时,并不会使用Dropout。

官方的文档如下,nn.dropout

例子

 import torch
 import torch.nn as nn
 ​
 m = nn.Dropout(p=0.2)
 input = torch.randn(20, 16)
 output = m(input)print(input[0])
 print(output[0])

输出的结果:
在这里插入图片描述

  1. 有一部分的值变为了0,这些值大约占据总数的0.2。
  2. 其它非0参数都除以0.8,使得值变大了。比如:0.3514 / 0.8 =0.4392,-1.0317 / 0.8 = -1.2896

Dropout的位置

一般来说,我们在实现的神级网络中这么定义:

self.dropout = nn.Dropout(0.3)

Dropout使用位置是在隐藏层之间的节点上,具体来说,就是在全连接层之间放置Dropout来避免过拟合:

 import torch
 import torch.nn as nn
 ​
 class Net(nn.Module):
     def __init__(self):
         super(Net, self).__init__()
         self.fc1 = nn.Linear(in_features, hidden_size)
         self.dropout = nn.Dropout(dropout_prob)
         self.fc2 = nn.Linear(hidden_size, out_features)
     
     def forward(self, x):
         x = self.fc1(x)
         x = self.dropout(x)
         x = torch.relu(x)
         x = self.fc2(x)
         return x

比如上面得这个例子,dropout被放置在fc1和fc2之间。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值