吴恩达 DeepLearning.ai 笔记(2)理解dropout

Dropout为什么可以减少过拟合?
(1)它会随机丢弃掉一些结点,所以看起来是在更小的网络上训练。
(2)以下图紫圈的神经元为例,由于在中间做了dropout,所以向它输入的四个神经元可以随机失活,所以紫圈神经元不能把所有权重都压在一个输入神经元上面,以此来控制权重。(和L2正则化达到的效果类似)
在这里插入图片描述
举例:如下图,可以对不同的层使用不同的留存率。对于7*7的权值矩阵,使用0.5的留存率(过拟合的概率高),而其他层设置较小的留存率。
在这里插入图片描述
其他:
dropout在计算机视觉中使用较多。(像素数据多)
使用dropout使得损失函数的效果不那么明确,而且无法作图观察模型表现。

PS:
L2正则化即在权值上加惩罚项的方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值