深度学习日常学习记录——激活函数

原创已于 2025-04-11 13:40:55 修改 · 1.7k 阅读

·

39

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #人工智能

于 2025-03-31 23:06:21 首次发布

深度学习日常学习记录——激活函数

文章目录

深度学习日常学习记录——激活函数
前言
一、激活函数的作用？
二、激活函数分类
三、激活函数使用

前言

真实世界中的万物是由复杂数学公式来表征的，由光学、电学、物理学、化学、生物学等众多学科组成。深度神经网络层之间为线性连接，增加网络的广度和深度都无法增加网络非线性计算能力。因此，为了让神经网络更好的理解世界，需要设计激活函数来拟合复杂公式

一、激活函数的作用？

非线性表达
防止梯度消失
加速模型收敛

二、激活函数分类

序号	激活函数	公式	优点	缺点
1	sigmoid函数	$\sigma(x) = \frac{1}{1+e^{-x}}$		梯度消失，产生饱和神经元；非零中心，收敛缓慢、无法体现个体神经元收敛
2	tanh函数	$tanh(x)=\frac{e^{x} - e^{-x}}{e^{x}+e^{-x}}$	以零为中心，加速收敛	梯度消失，产生饱和神经元
3	RELU函数	$f(x)=\begin{cases} x & \text{if} x >0 \\ 0 & \text{if} x \leq 0 \end{cases}$	计算高效，缓解梯度消失	dead神经元，不以零为中心，给后一层神经元产生偏移
4	Leaky RELU函数	$f(x)=\begin{cases} x & \text{if} x > 0 \\ \gamma x & \text{if} x \leq 0 \end{cases}$	缓解dead 神经元问题
5	ELU函数	$f(x)=\begin{cases} x & \text{if} x > 0 \\ \alpha (e^{x} - 1 ) & \text{if} x \leq 0 \end{cases}$	没有dead 神经元问题，正负平均，以零为中心,有饱和域	计算量大
6	SeLU函数	$\gamma \begin{cases} x & \text{if} x > 0 \\ \alpha (e^{x} - 1 ) & \text{if} x \leq 0 \end{cases}$	放大input的变化
7	Swish函数	$\sigma(x)=x \times sigmoid(\beta x)$	自门控激活函数
8	Maxout函数		三维求取最大输出
9	Softplus函数

三、激活函数使用

激活函数	LaTeX 公式	PyTorch 调用方式	特性说明
Sigmoid	$\sigma(x) = \frac{1}{1 + e^{-x}}$	`nn.Sigmoid()`	输出范围 (0,1)，适合概率输出
Tanh	$\tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}}$	`nn.Tanh()`	输出范围 (-1,1)，零中心化
ReLU	$\text{ReLU}(x) = \max(0, x)$	`nn.ReLU()`	简单高效，但负区梯度为 0
LeakyReLU	$\text{LeakyReLU}(x) = \begin{cases} x & x \geq 0 \\ \alpha x & x < 0 \end{cases}$	`nn.LeakyReLU(alpha=0.01)`	缓解神经元死亡，需调参 `alpha`
ELU	$\text{ELU}(x) = \begin{cases} x & x \geq 0 \\ \alpha (e^x - 1) & x < 0 \end{cases}$	`nn.ELU(alpha=1.0)`	平滑负区，缓解梯度消失
SELU	$\text{SELU}(x) = \lambda \begin{cases} x & x \geq 0 \\ \alpha (e^x - 1) & x < 0 \end{cases}$ （ $\lambda \approx 1.0507$ , $\alpha \approx 1.6733$ ）	`nn.SELU()`	自归一化网络专用，需特定初始化
Swish	$\text{Swish}(x) = x \cdot \sigma(\beta x)$	手动实现：`x * torch.sigmoid(beta * x)`	平滑非单调，实验表现优
Maxout	$\text{Maxout}(x) = \max_{i \in [1,k]}(w_i^T x + b_i)$	自定义实现（无内置）	拟合能力强，但参数量大
Softplus	$\text{Softplus}(x) = \frac{1}{\beta} \log(1 + e^{\beta x})$	`nn.Softplus(beta=1)`	平滑 ReLU，处处可导

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。