sigmoid和softmax总结

sigmoid函数(也叫逻辑斯谛函数):
 引用wiki百科的定义:

A logistic function or logistic curve is a common “S” shape (sigmoid curve).

其实逻辑斯谛函数也就是经常说的sigmoid函数,它的几何形状也就是一条sigmoid曲线。

这里写图片描述

logistic曲线如下:
  这里写图片描述

同样,我们贴一下wiki百科对softmax函数的定义:

softmax is a generalization of logistic function that “squashes”(maps) a K-dimensional vector z of arbitrary real values to a K-dimensional vector σ(z) of real values in the range (0, 1) that add up to 1.

这句话既表明了softmax函数与logistic函数的关系,也同时阐述了softmax函数的本质就是将一个K维的任意实数向量压缩(映射)成另一个K

维的实数向量,其中向量中的每个元素取值都介于(0,1)之间。

softmax函数形式如下:
  这里写图片描述

总结:sigmoid将一个real value映射到(0,1)的区间(当然也可以是(-1,1)),这样可以用来做二分类。
而softmax把一个k维的real value向量(a1,a2,a3,a4…)映射成一个(b1,b2,b3,b4…)其中bi是一个0-1的常数,然后可以根据bi的大小来进行多分类的任务,如取权重最大的一维。

sigmoidsoftmax是常用的激活函数,它们在机器学习深度学习中广泛应用于二分类多分类问题中。 ### 1. Sigmoid 函数 Sigmoid函数的公式如下: $$ \sigma(x) = \frac{1}{1 + e^{-x}} $$ - **作用**:将实数域的输入映射到(0,1)区间,可以解释为概率。 - **适用场景**:主要用于二分类问题的输出层。 **Python代码实现:** ```python import numpy as np def sigmoid(x): return 1 / (1 + np.exp(-x)) # 示例 x = np.array([0, 2, -1]) print(sigmoid(x)) # 输出: [0.5 0.88079708 0.26894142] ``` --- ### 2. Softmax 函数 Softmax函数的公式如下: $$ \text{softmax}(x_i) = \frac{e^{x_i}}{\sum_{j} e^{x_j}} $$ - **作用**:将一个向量的每个元素映射到(0,1)区间,并且所有元素的为1,可以解释为概率分布。 - **适用场景**:主要用于多分类问题的输出层。 **Python代码实现:** ```python import numpy as np def softmax(x): exp_x = np.exp(x - np.max(x)) # 防止指数爆炸 return exp_x / np.sum(exp_x, axis=0) # 示例 x = np.array([2.0, 1.0, 0.1]) print(softmax(x)) # 输出: [0.65900114 0.24196462 0.09903424] ``` --- ### 3. 两者的区别与联系 | 特性 | Sigmoid | Softmax | |--------------|----------------------------|---------------------------------| | 输出维度 | 单个值 | 向量 | | 输出 | 不为1 | 为1 | | 应用场景 | 二分类 | 多分类 | | 是否相互影响 | 各输入独立 | 各输入相互影响 | --- ### 4. 补充说明 - **Sigmoid的缺点**: - 梯度消失问题:当输入很大或很小时,梯度接近0。 - 输出不是以0为中心,可能影响收敛速度。 - **Softmax的稳定性优化**: - 在实现中,通常会减去最大值 `np.max(x)` 来防止指数爆炸。 ---
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值