深度学习常用的激活函数、优化器? 各自的优缺点

最新推荐文章于 2025-08-27 22:49:38 发布

原创最新推荐文章于 2025-08-27 22:49:38 发布 · 171 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能

本文概述了深度学习中常用的激活函数（如Sigmoid、ReLU、LeakyReLU等）、优化器（如SGD、Adam及其变种）以及梯度问题（梯度消失和爆炸）的解决策略，包括归一化方法和权重初始化技巧。

深度学习常用的激活函数有哪些?

1⃣Sigmoid函数: f(x) = 1 /(1 + exp(-x))
2⃣ReLU函数: fx) = max(0,x)
3⃣Leaky ReLU函数: f(x) = max(0.01x,x)
4⃣Tanh函数: f(x) = (exp(x) - exp(-x)) /(exp(x)+exp(-x))
5⃣Softmax函数: f(x i) = exp(x i) / sum(exp(x_j))
6⃣Swish函数: f(x) = x* sigmoid(x)
7⃣Softplus函数: f ( x ) =In ( 1 + exp x ）

深度学习有哪些优化器? 各自的优缺点?

1⃣Stochastic Gradient Descent ( SGD ): 迭代速度快，但是容易陷入局部解
2⃣SGD with momentum: 加速SGD，但可能跳出最优解
3⃣AdaGrad: 考虑历史梯度的数据，动态调整参数
4⃣RMSprop: 相比AdaGrad增加了衰减因子，提高计算速度
5⃣Adam: 结合动量和RMSProp优点，使用较多

6AdamW: Adam结合weight decay，提高计算速度，通常用此方法