【线性回归方法】Logistic Regression_logisticregression可以做线性回归吗-优快云博客

本文链接：https://blog.youkuaiyun.com/JasonDean/article/details/122742862

1 Logistic 回归原理

Logistic 回归模型是一种典型的线性回归分类机。

从数据集角度分析，假定一种有 $m$ 个样本的数据集为：
$T=\{(x^{(1)},y^{(1)}),\cdots,(x^{(m)},y^{(m)})\}$
其中 $,mx^{(i)}\in \mathbb{R}^n, i =1,2,\cdots,m$ , 表示数据集有 $n$ 个 features. $,my^{(i)}\in \{0,1\}, i =1,2,\cdots,m$ ，代表0-1分类。
Logistic 回归的目的就是，已知 $x$ ，预测 $x$ 对应的类别标签 $y$ .

1.1 Logistic 回归模型结构

下面例子假设数据集有2个features n=2，则 $x(i)∈{x(1),x(2)}x^{(i)} \in \{x^{(1)},x^{(2)}\}$
则模型结构如下
请添加图片描述
即为：
$Y^*=\sigma(W^{\rm T}X+b)$
利用数据集理解该公式，即已知 $x$ ，得到 $y = 1$ 的条件概率为：
$1|𝒙)=Y^*=\sigma(W^{\rm T}X+b) \in (0,1)$
则 Logistic回归的分类判别标准为：
$P(y^{(i)}=1| x^{(i)})=\frac{1}{1+e^ {\left(-\boldsymbol{w}^{\top} \boldsymbol{x^{(i)}}-b\right)}} \\ P(y^{(i)}=0| x^{(i)})=\frac{e^ {\left(-\boldsymbol{w}^{\top} \boldsymbol{x^{(i)}}-b\right)}}{1+e^ {\left(-\boldsymbol{w}^{\top} \boldsymbol{x^{(i)}}-b\right)}}$
选取概率最大的作为分类结果即可。

值得一提的是, Logistic 回归中， $W_1,W_2$ 对应着 $X_1,X_2$ 的乘子，但是 $b$ 对于 $X_1,X_2$ 是一个相等的实数，即 $Z = [W_1 W_2][X_1X_2]^T+b$

$b$ 仅仅为一个实数，而 $W$ 是一个 $(2×1)(2\times 1)$ 的向量
对于参数可更新的模型，我们可以利用梯度下降算法优化参数 $W$ 和 $b$ 从而提升模型性能。

2. 为何说Logistic 回归为一个线性回归模型

判断一个模型是否线性，及判断其决策边界（decision boundary）是否为直线

Logistic 回归的决策边界定义为：
$\frac{P(y=1|x)}{P(y=0|x)}=\frac{1}{e^ {\left(-\boldsymbol{w}^{\top} \boldsymbol{x^{(i)}}-b\right)}}=1$
则边界为：
$-\boldsymbol{w}^{\top} \boldsymbol{x^{(i)}}-b = 0$
对于一个二分类 2 features 模型而言，其数据集分类图如下，请添加图片描述
可见其决策边界为线性，其模型是线性模型。