Empirical Evaluation of Rectified Activations in Convolutional Network笔记

最新推荐文章于 2023-03-20 12:13:34 发布

原创最新推荐文章于 2023-03-20 12:13:34 发布 · 1.2k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#RReLU #网络调参 #CNN #读数笔记

CNN 专栏收录该内容

7 篇文章

订阅专栏

链接

https://arxiv.org/abs/1505.00853

摘要

论文研究集中不同的ReLU对网络性能的影响，包括ReLU、Leaky ReLU，带参数的Leaky ReLU就是PReLU，以及参数随机的RReLU。
以往的看法是ReLU的良好性能来自参数的稀疏性，但实验结果表明负数部分斜率不为0的ReLU性能要好一些。在小的数据集上，采用Leaky ReLU或者PReLu都容易造成过拟合。RReLU的性能要更好。

值得注意的问题

对于RReLU，在训练阶段 $a_{i,j}$ 的取值是在 $l, u$ 之间均匀分布的一个随机数，也就是

$y_{ji}= \left\{ \begin{aligned} x_{ji} , \qquad x_{ji} \ge0 \\ a_{ji}x_{ji} , \qquad x_{ji} \lt 0 \end{aligned} \right.$

而

$a_{ji} \sim U(l,u), \qquad l<u\quad and\quad l,u\in[0,1)$

在Test Phase，

$y_{ji}=\frac{l+u}{2}x_{ji}$

参考Dropout的思路。

可以借鉴的思路

小数据集可以采用RReLU的策略，但 $l, u$ 怎么选择可能也要经验。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。