三、深度学习基础4（激活函数2）

满满myno

已于 2022-04-26 09:17:57 修改

阅读量1.1k

点赞数 3

分类专栏：深度学习(上) 文章标签：机器学习深度学习 opencv 人工智能

于 2022-04-25 20:14:48 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_53832681/article/details/124413095

版权

如何选择激活函数

选择一个适合的激活函数并不容易，需要考虑很多因素，通常的做法是，如果不确定哪一个激活函数效果更好，可以把它们都试试，然后在验证集或者测试集上进行评价。然后看哪一种表现的更好，就去使用它。
以下是常见的选择情况：
1、如果输出是 0、1 值（二分类问题），则输出层选择 sigmoid 函数，然后其它的所有单元都选择 Relu 函数。
2、如果在隐藏层上不确定使用哪个激活函数，那么通常会使用 Relu 激活函数。有时，也会使用 tanh 激活函数，但 Relu 的一个优点是：当是负值的时候，导数等于 0。
3、sigmoid 激活函数：除了输出层是一个二分类问题基本不会用它。
4、tanh 激活函数：tanh 是非常优秀的，几乎适合所有场合。
5、ReLu 激活函数：最常用的默认函数，如果不确定用哪个激活函数，就使用 ReLu 或者Leaky ReLu，再去尝试其他的激活函数。
6、如果遇到了一些死的神经元，我们可以使用 Leaky ReLU 函数。

ReLu 激活函数的优点

1、在区间变动很大的情况下，ReLu 激活函数的导数或者激活函数的斜率都会远大于 0，在程序实现就是一个 if-else 语句，而 sigmoid 函数需要进行浮点四则运算，在实践中，使用ReLu 激活函数神经网络通常会比使用 sigmoid 或者 tanh 激活函数学习的更快。
2、sigmoid 和 tanh 函数的导数在正负饱和区的梯度都会接近于 0，这会造成梯度弥散，而Relu 和 Leaky ReLu 函数大于 0 部分都为常数，不会产生梯度弥散现象。
3、需注意