机器学习入门之《统计学习方法》笔记整理—

本文介绍了逻辑回归的基本概念，包括逻辑斯谛分布及其图形特征，详细解析了二项逻辑斯谛回归模型的工作原理及数学表达，并给出了Python实现代码。此外还讨论了多项逻辑斯谛回归在多分类问题中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

逻辑回归(logistic regression)是统计学习中的经典分类方法。其多用在二分类{0,1}问题上。最大嫡是概率模型学习的一个准则将其推广到分类问题得到最大熵模型(maximum entropy model)。逻辑回归模型与最大熵模型都属于对数线性模型。

文章目录

@[toc]
二项逻辑斯谛回归模型

##逻辑斯谛回归模型

###逻辑斯谛分布

设X是连续随机变量， $X$ 服从逻辑斯谛分布是指 $X$ 具有下列分布函数和密度函数

$F(x)=P(X\leq x)=\frac{1}{1+e^{-(x-\mu)/\gamma}}$

$f(x)=F^{'}(x)=\frac{e^{-(x-\mu)/\gamma}}{\gamma(1+e^{-(x-\mu)/\gamma})^2}$

分布函数属于逻辑斯谛函数，其图形是一条S形曲线。

这里写图片描述

二项逻辑斯谛回归模型

二项逻辑回归模型(binomial logistic regression model)是一种分类模型，用于二类分类。由条件概率分布 $P (Y ∣ X)$ 表示，形式为参数化的逻辑分布。这里，随机变量X取值为实数，随机变量Y取值为1或0。

二项逻辑斯谛回归模型是如下条件概率分布:

$P(Y=1|x)=\frac{\exp(w\cdot x+b)}{1+\exp(w\cdot x+b)}$

$P(Y=0|x)=\frac{1}{1+\exp(w\cdot x+b)}$

其中， $x\in\mathbb{R}^n,Y\in \{ 0,1 \}$ ， $w\in\mathbb{R}^n$ 和 $b\in\mathbb{R}$ .

逻辑回归对线性回归经行了归一化操作，将输出范围规定在{0,1}。

几率，指一件事件发生的概率与不发生的概率的比值，那么事件的对数几率或logit函数是

$logit(p)=\log \frac{p}{1-p}$

因此，

$logit(p)=\log \frac{P(Y=1|x)}{1-P(Y=1|x)}=w\cdot x$

这就是说，在逻辑回归模型中，输出Y=1的对数几率是输入x的线性函数。

通过逻辑回归模型可以将线性函数转化为概率：

$P(Y=1|x)=\frac{\exp(w\cdot x)}{1+\exp(w\cdot x)}$

线性函数值越接近正无穷，概率越接近1；线性函数值越接近负无穷，概率值越接近0。这样的模型称为逻辑回归模型。

Python代码如下：

import numpy as np
def predict(x,w):
    return 1.0/1.0+np.e**(-x.dot(w))

def iter_w(x, y, a, w):
    prediction = predict(x,w)
    g = (prediction - y) * x
    w = w+ a * g * (1.0 / y.size)
    return w

while counter < max_epochs:
    counter += 1
    for i in range(len(Y)):
        w = update(X[i,:], Y[i], a, w)