PyTorch -- 最常见激活函数的选择

原创

已于 2025-09-08 18:01:21 修改 · 997 阅读

·

15

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#pytorch #人工智能 #python

于 2024-06-12 23:10:42 首次发布

PyTorch 常用非线性激活函数详解

首先，简单复习下什么是梯度：梯度是偏微分的集合
- 举例说明：对于 $y^2-x^2: \nabla z= (\frac{\partial z}{\partial x}, \frac{\partial z}{\partial y}) = （2x, 2y）$
获取极小值 minima 的方法核心： $\theta_{t+1}=\theta_t-\alpha\nabla f(\theta_t)$

本文总结了深度学习中常见的几种激活函数，包括 Sigmoid, Tanh, ReLU, Softmax

文章目录

PyTorch 常用非线性激活函数详解
- 1. Sigmoid
- 2. Tanh
- 3. ReLU
- 4. Softmax
- 总结

1. Sigmoid

【torch.sigmoid(x)】
$\text{Sigmoid}(x)=\frac{1}{1+e^{-x}}$
- 优点：连续可导，常用作二分类输出层
- 缺点：在 |x| 非常大时饱和 (函数会变得很平)，对 x 的微小改变会变得不敏感；在反向传播时，梯度趋近 0 → 容易出现 梯度消失，从而无法完成深层网络训练
- PyTorch 使用：对应类 torch.nn.Sigmoid
```
import torch
import torch.nn as nn

# 1) 准备输入
x = torch.linspace(-5, 5, 10)

# 2.1) 使用方法一
out1 = torch.sigmoid(x)        # 函数式

# 2.2) 使用方法二
layer = nn.Sigmoid()           # 模块式
out2 = layer(x)
```

2. Tanh

【torch.tanh(x)】 sigmoid 经过缩放平移获得
$\text{Tanh}(x) = \frac{e^x-e^{-x}}{e^x+e^{-x}}$

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。