激活函数notes

小裴（碎碎念版）

于 2025-07-12 13:08:25 发布

阅读量680

点赞数 16

CC 4.0 BY-SA版权

文章标签：机器学习 python

本文链接：https://blog.youkuaiyun.com/Drunk_awm/article/details/149290285

常用激活函数

激活函数的作用：提供非线性

1.Sigmoid
输出范围在 (0, 1)，适合二分类问题。公式为：
$\sigma(x) = \frac{1}{1 + e^{-x}}$
缺点：易导致梯度消失，输出非零中心化。

2.Tanh
输出范围在 (-1, 1)，零中心化。公式为：
$\tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}}$
梯度消失问题仍存在，但优于Sigmoid。

3.ReLU
计算高效，缓解梯度消失。公式为：
$\text{ReLU}(x) = \max(0, x)$
缺点：神经元可能“死亡”（输出恒为0）。

4.Leaky ReLU
解决ReLU的死亡问题，引入微小负斜率（如0.01）。公式为：
$\text{LeakyReLU}(x) = \begin{cases} x & \text{if } x \geq 0 \\ \alpha x & \text{if } x < 0 \end{cases}$

5.Parametric ReLU (PReLU)
将Leaky ReLU的斜率 $α\alpha$ 作为可学习参数。

6.ELU（Exponential Linear Unit）
负值区域平滑，缓解死亡问题。公式为：
$\text{ELU}(x) = \begin{cases} x & \text{if } x \geq 0 \\ \alpha(e^x - 1) & \text{if } x < 0 \end{cases}$