机器学习笔记（十）——Logistic Function AND Softmax Function

原创已于 2025-07-24 17:25:52 修改 · 3k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #softmax

于 2016-06-03 17:11:21 首次发布

机器学习专栏收录该内容

30 篇文章

订阅专栏

本文详细介绍了Logistic函数及其导数，并解释了其在二分类问题中的应用。此外，还介绍了Softmax函数，它是Logistic函数的扩展，适用于多分类问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、说明

在逻辑回归和一些机器学习算法中， Logistic函数和Softmax函数是常用到的，今天就先讨论下这两个函数。

二、Logistic Function

Logistic function一般用于二分类问题，它的函数定义如下：
$\frac{1}{1+e^{-x}} (1)$
它的图像如下：
logistic 函数图形

由于logistic 函数的图形很像S，所以也叫sigmod 曲线。下面求一下logistic函数的导数，它在机器学习算法的推导过程中可能用到。
$[(1+e^{-x})^{-1}]' \\ = -(1+e^{-x})^{-2}*e^{-x}*(-1) \\ = \frac{e^{-x}}{(1+e^{-x})^2} \\ = \frac{1}{1+e^{-x}} \frac{e^{-x}}{1+e^{-x}} \\ = \frac{1}{1+e^{-x}} \frac{1+e^{-x}-1}{1+e^{-x}} \\ =\frac{1}{1+e^{-x}} (1- \frac{1}{1+e^{-x}}) \\ =f(x)[1-f(x)]$
即 $f^{'} (x) = f (x) [1 - f (x)]$
通过logistic函数，可以把变量 $x$ 映射到[0, 1]之间,在分类问题上，x是训练集上数据和对应维度特征参数的组合： $θTx+b\boldsymbol{\theta ^Tx}+b$ , 具体会在后边讲到。

三、Softmax Function

Softmax function 是sigmod 函数的扩展，它可以用于多分类问题。它的定义如下所示：
$Y_k =\phi(z_k)= \frac{e^{z_k}}{\sum_{i=1}^Ke^{z_i}}, k= 1,2, \dots, K$
其中， $z$ 往往是关于参数和样本数据的复合函数，softmax 函数的目的是求使得$Y_k $取值最大的$ z $中的参数，$ k $表示有 k 个分类。! [$ Y_k概率分布图 $] (h ttp s : // im g - b l o g . cs d n . n e t /20160603165051193) 图中的$ P(t|z) $表示对于给定的输入$ z $, 它属于 t 的概率值。关于具体的推导，可参照文献 2. 但是注意，文献 2 中的$ \phi_K = \frac{\phi_i}{e^{\beta_i}}$, 有问题请随时留言。