初始PyTorch（二）：激活函数

最新推荐文章于 2025-09-09 06:00:00 发布

原创最新推荐文章于 2025-09-09 06:00:00 发布 · 299 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

深度学习同时被 2 个专栏收录

30 篇文章

订阅专栏

15 篇文章

订阅专栏

本文深入探讨了常见的激活函数，包括Sigmoid、Tanh、ReLU及Softmax的特性与应用。解析了每种函数的工作原理，求导过程，以及它们在神经网络训练中可能遇到的问题，如梯度消失和爆炸。

激活函数σ：

常见的激活函数 — 常见的激活函数题

1.Sigmoid/logistic 区间[0, 1]

$f(x)=\sigma (x)=\frac{1}{1+e^{-x}}$

求导：

a=torch.linspace(-100,100,10)
torch.sigmoid(a)

原始a:

sigmoid后：

缺陷：当x->+∞时，σ'=0，导致参数θ=θ-lr*θ'得不到更新，也就是梯度离散问题。

2.Tanh 区间[-1, 1]

$f(x)=\frac{e^{x}-e^{-x}}{e^{x}+e^{-x}}=2*\sigma (2x)-1$

求导：

a=torch.linspace(-1,1,10)
torch.tanh(a)

tanh后：

3.Relu(常用***)

from torch.nn import functional as F
a=torch.linspace(-1,1,10)
F.relu(a) #等同于torch.relu(a)

relu后：

4.softmax

用于处理分类问题，总概率和相加为1。

softmax函数：，。

求导分为i=j和i≠j：

F.softmax(a, dim=0)

//p.backword()，torch把梯度信息保存在W.grad后会把该图的梯度信息清除掉，需要设置retain_graph = True才能二次调用backward。

//grad or backward传入的feature只能为一个量，例如p是一个[3]的量，所以不能传[p]，需要传p[1]。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

nooobme 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。