动手学习机器学习（Day8丢弃法Dropout）

m0_63453494

已于 2023-04-28 18:50:40 修改

阅读量127

点赞数

分类专栏：动手学习机器学习文章标签：学习机器学习人工智能

于 2023-04-28 18:46:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_63453494/article/details/130432788

版权

动手学习机器学习专栏收录该内容

11 篇文章

订阅专栏

给全连接层使用

动机

一个好的模型需要对输入数据的扰动鲁棒，即对于输入的噪音，能有一定的鲁棒性
- 使用有噪音的数据等价于Tikhonov正则
- 丢弃法：在层之间加入噪音

无偏差的加入噪音

对 $\mathbf{x}$ 加入噪音得到 $\mathbf{x}^{`}$ ，加噪音是为了提高鲁棒性，因此我们希望加入噪音后不改变期望，即
$\mathbf{E[x^{`}]=x}$
丢弃法对每个元素进行如下扰动

这种方法 $\mathbf{E[x_{i}^{`}]}$ 没有变化

使用丢弃法

通常将丢弃法作用在隐藏全连接层的输出上

图中是对隐藏层采用dropout，即对于激活函数输出后的 $\mathbf{h}$ ，通过dropout以概率 $p$ 将值变为0，以概率 $1 - p$ 将值变为 $\frac{h_i}{1-p}$ ，可以看到右边 $h_2$ 和 $h_5$ 消失了，然后对于 $\mathbf{o}$ 的计算，参数来自于丢弃法作用后的 $\mathbf{h}^`$ ，再用softmax计算结果

推理中的丢弃法

正则项只在训练中使用：他们影响模型参数的更新
在推理过程中，丢弃法直接返回输入
$\mathbf{h}=dropout(\mathbf{h})$
- 这样也能保证确定性的输出

总结

丢弃法将一些输出项随机置0来控制模型复杂度
常作用在多层感知机的隐藏层输出上
丢弃概率是控制模型复杂度的超参数
dropout随机丢弃，如果想要保持结果可重复性，需要控制随机的seed，一个是randn的seed，一个是dropout参数，平时没必要可重复
丢弃法在训练时把某些神经元丢弃，在此时的训练不把这些神经元的参数更新，而在预测时网络中的神经元是没有丢弃的

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。