几种激活函数的详解及代码实现：sigmoid()、softmax()、tanh()、relu()、leaky_relu()

最新推荐文章于 2025-10-19 08:51:31 发布

原创

最新推荐文章于 2025-10-19 08:51:31 发布 · 5.3k 阅读

35 ·

CC 4.0 BY-SA版权

文章标签：

#神经网络 #机器学习

import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

1.sigmoid()函数

# Sigmoid函数常被用作神经网络的激活函数，将变量映射到0,1之间
# 除了输出层是一个二元分类问题外，基本不用Sigmoid函数
def sigmoid(x):
    y = 1/(1+np.exp(-x))
    return y

曲线绘制：

X = np.arange(-5, 5, 0.1)
y = sigmoid(X)
plt.plot(X, y)
plt.ylim(-0.1, 1.1)
plt.scatter(0,0.5,marker='*',c='r')
plt

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Amanda_ABAP_Python

关注关注

5
点赞
踩
35

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

简述Sigmoid函数（附Python代码）

大脸猫的博客

11-25

5万+

sigmoid函数也叫Logistic函数，用于隐层神经元输出，取值范围为(0,1)，它可以将一个实数映射到(0,1)的区间，可以用来做二分类。在特征相差比较复杂或是相差不是特别大时效果比较好。Sigmoid作为激活函数有以下优缺点：优点：平滑、易于求导。缺点：激活函数计算量大，反向传播求误差梯度时，求导涉及除法；反向传播时，很容易就会出现梯度消失的情况，从而无法完成深层网络的训练。 ...

【DL经典回顾】激活函数大汇总（一）（Sigmoid & Tanh & ReLU & Leaky ReLU & PReLU附代码和详细公式）

悦学共鸣，温柔以待，汇聚光芒，共同成长

03-13

2616

欢迎来到我们深入探索神经网络核心组成部分——激活函数的系列博客。鉴于激活函数的重要性和多样性，我们将通过几篇文章的形式，每篇详细介绍五种激活函数，旨在帮助读者深入了解各种激活函数的特点、应用场景及其对模型性能的影响。

参与评论您还未登录，请先登录后发表或查看评论

激活函数sigmoid和激活函数softmax

橙子Blue不加冰

12-29

1万+

1.激活函数sigmoid Sigmoid函数是一个在生物学中常见的S型函数，也称为S型生长曲线。在信息科学中，由于其单增以及反函数单增等性质，Sigmoid函数常被用作神经网络的激活函数，将变量映射到0,1之间。图像归一化的过程： ...

AI 内容分享(十八)：秒懂AI-深度学习四种常用激活函数：Sigmoid、Tanh、ReLU和Softmax

之乎者也·的博客

01-20

4964

Softmax是一种常用的激活函数，主要用于多分类问题中，可以将输入的神经元转化为概率分布。ReLU的输出范围是[0, +∞)，而输入值为负数时输出为0，这导致ReLU输出的分布不对称，限制了生成的多样性。Leaky ReLU在输入小于或等于0时，输出一个较小的斜率，避免了完全的“死亡神经元”问题。当输入值小于或等于0时，ReLU的输出为0，导致该神经元失效，这种现象称为“死亡神经元”。与Leaky ReLU不同的是，PReLU的斜率不是固定的，而是可以根据数据进行学习优化。

Sigmoid函数详解

热门推荐

ACdreamer

01-25

5万+

莫比乌斯函数值： int mobi(int n) { int m=1; for(int i=2;i*i<=n;i++) { if(n%i==0) { m*=-1; int k=0; do {

常用激活函数activation function（Softmax、Sigmoid、Tanh、ReLU和Leaky ReLU) 附激活函数图像绘制python代码

记录知识，学习分享

04-10

4万+

激活函数是确定神经网络输出的数学方程式。 激活函数的作用：给神经元引入了非线性因素，使得神经网络可以任意逼近任何非线性函数。 1、附加到网络中的每个神经元，并根据每个神经元的输入来确定是否应激活。 2、有助于将每个神经元的输出标准化到1到0或-1到1的范围内。常用非线性激活函数对比 激活函数 公式函数图像适合场景 Softmax 多分类任务输出层 Sigmoid 二分类任务输出层，模型隐藏层 Tanh

【pytorch（08）】激活函数：sigmoid，tanh，ReLU，LeakyReLU，softmax

2302_76685892的博客

08-11

794

稀疏激活：ReLU在输入小于等于 0 时输出为 0，这使得 ReLU 可以在神经网络中引入稀疏性（即一些神经元不被激活），这种稀疏性可以减少网络中的冗余信息，提高网络的效率和泛化能力。缓解梯度消失问题：相比于 Sigmoid 和 Tanh 激活函数，ReLU 在正半区的导数恒为 1，这使得深度神经网络在训练过程中可以更好地传播梯度，不存在饱和问题。这使得 Softmax 函数的输出中，最大值对应的概率会相对较大，而其他值对应的概率会相对较小，从而提高数值稳定性。之间，因此输出是零中心的。

sigmoid激活函数

zrh_优快云的博客

07-31

1578

sigmoid sigmoid 是使用范围最广的一类激活函数，具有指数函数形状，它在物理意义上最为接近生物神经元。此外，(0, 1) 的输出还可以被表示作概率，或用于输入的归一化，代表性的如Sigmoid交叉熵损失函数。然而，sigmoid也有其自身的缺陷，最明显的就是饱和性。从上图可以看到，其两侧导数逐渐趋近于0 。具有这种性质的称为软饱和激活函数...

神经网络的激活函数之sigmoid

01-07

根据每一层前面的激活、权重和偏置，我们要为下一层的每个激活计算一个值，但在将该值发送给下一层之前，要是用激活函数对这个输出进行缩放。 sigmoid函数 sigmoid函数是一个logistic函数，意思是说不管输入什么，输出都在0到1之间，也就是输入的每个神经元、节点或激活都会被锁放在一个介于0到1之间的值。 sigmoid 这样的函数常被称为非线性函数，因为我们不能用线性的项来描述它。很多激活函数都是非线性或者线性和非线性的组合这个问题与反向传播有关，在反向传播中，我们要计算每个权重的梯度，即针对每个权重的小更新，这样做的目的是优化整个网络中激活值的输出，使其能在输出层得到更好的结果，

Sigmoid激活函数

qlkaicx的博客

04-17

2299

σx1e−x1其中，x是函数的输入，σx是函数的输出。sigmoid函数在神经网络中常被用于二元分类任务，因为它可以将输入转换成概率值。Sigmoid函数是一个在生物学中常见的S型函数，也称为逻辑函数，它可以将一个实数映射到(0,1)的区间内。在深度学习和机器学习的上下文中，它经常被用作神经元的激活函数，因为它可以将任意输入压缩到0和1之间，从而方便地进行概率解释。需要注意的是，当输入x。

sigmoid函数_激活函数

weixin_39600400的博客

11-23

2246

为什么使用激活函数如果没有激活函数，神经网络就变成了线性模型，输出是输入的线性组合，使用一层与使用多层没有区别。如下式所示，输入为x，经过线性层计算出a1，将a1输入下个线性层得到a2，展开后可以看出，最终得到的仍然是wx+b的线性组合，只是参数值不同。另外，线性层无法解决非线性问题，如在预测房价问题中，如果不使用激活函数，则房价可能计算成负值，这也与实际不符。理论上，加了激活函数后，模型可以逼近...

激活函数（1）Sigmoid激活函数

zfjBIT的专栏

06-12

1万+

激活函数 神经网络中的每个神经元节点接受上一层神经元的输出值作为本神经元的输入值，并将输入值传递给下一层，输入层神经元节点会将输入属性值直接传递给下一层（隐层或输出层）。在多层神经网络中，上层节点的输出和下层节点的输入之间具有一个函数关系，这个函数称为激活函数（又称激励函数）。引入激活函数可以增加圣经网络模型的非线性，以便增加对样本非线性关系的拟合能力：如果不用激励函数（其实相当于激励函...

深度学习--激活函数之sigmoid激活函数

weixin_43464623的博客

08-06

1万+

1.简介 激活函数是深度神经网络中每一个神经元线性加权计算结果的非线性处理，赋予神经网络非线性映射能力。每一种激活函数都有不同的功能，本篇主要介绍sigmoid激活函数。 sigmoid激活函数应该是深度神经网络最先使用的激活函数，主要用于逻辑回归（logistic regression），实现分类功能。sigmoid函数的公式如下： 4.pytorch代码 #include <iostream> 5.效果 5.1输入图片 ...

激活函数 - sigmoid

weixin_74923758的博客

01-11

669

激活函数作为神经网络中的一种关键组件，用于引入非线性因素，使神经网络能够学习和模拟复杂的非线性关系。在神经网络中，每个神经元的输出通常经过一个激活函数进行变换，然后再传递给下一层神经元。

sigmoid neurons（激活函数）

qq_36399828的博客

06-16

546

在perception中，如果只是随意改变一个权重，使结果朝着自己想要的方向发展（如数字识别将“8”误认为“9”，对此进行修改），可能会引起其他识别结果的剧烈变化，如原来识别正确的都变错了。因此，引入sigmoid neuron的概念介绍：和介绍perception 一样，sigmoid 具有输入x1,x2,x3 只是输入不是局限于0和1，可以是0和1之间的任何数。sigmoid有权重w1...

深度学习之激活函数——Sigmoid

m0_61787307的博客

05-14

7964

Sigmoid函数，又称logistic函数，是最早使用的激活函数之一。但是由于其固有存在的一些缺点，如今很少将其作为激活函数，但是依然常用于二分类问题中的概率划分。

Sigmoid、Tanh、Relu和Softmax

01-21

### 不同激活函数的特点和应用场景 #### Sigmoid 函数特点及应用场合 Sigmoid 函数定义域为实数集，值域位于 (0, 1)，具有平滑渐近线特性。然而，在神经网络训练过程中容易遇到饱和区间的梯度消失问题，即当输入过大或过小时，导数值趋近于零，阻碍误差逆向传递效率。尽管如此，对于二分类任务而言，Sigmoid 可作为输出层的理想选择之一[^1]。 #### Tanh 函数特点及应用场合 Tanh 函数同样适用于隐藏层节点，相较于 Sigmoid 而言，前者能够提供更加紧凑的数据映射范围 [-1, 1] 并且关于原点对称。这种性质使得模型参数初始化阶段更容易获得较小的标准差分布，从而加速收敛过程并提高泛化能力。不过需要注意的是，Tanh 同样存在类似于 Sigmoid 的梯度弥散现象[^3]。 #### ReLU 函数特点及应用场合 ReLU（Rectified Linear Unit）是一种简单有效的非线性变换方法，它只保留正半轴上的数据而将负半部分置零处理。相比于前两者，ReLU 显著减少了计算复杂度并且有效缓解了深层架构下的梯度消退难题；另外值得注意的地方在于，如果输入持续保持为负，则对应权重可能永远无法得到更新机会，形成所谓“死亡神经元”。因此实践中常采用 Leaky ReLU 或 Parametric ReLU 来改进这一缺陷[^2]。 #### Softmax 函数特点及应用场合 Softmax 函数主要用于解决多类别分类场景下概率估计需求。通过指数运算放大差异项之后再做标准化操作，最终得到一组满足加权求和等于一的概率型预测结果。此机制不仅赋予各个候选标签合理的置信水平评估依据，而且确保了整个系统的稳定性和鲁棒性。特别是在面对大规模离散空间探索时表现出色，成为现代深度学习框架不可或缺的重要组成部分。 ```python import numpy as np def sigmoid(x): return 1 / (1 + np.exp(-x)) def tanh(x): return np.tanh(x) def relu(x): return np.maximum(0, x) def softmax(x): exp_x = np.exp(x - np.max(x)) return exp_x / exp_x.sum(axis=0) ```