【线性回归方法】Logistic Regression

1 Logistic 回归原理

Logistic 回归模型是一种典型的线性回归分类机。

从数据集角度分析,假定一种有 m m m 个样本的数据集为:
T = { ( x ( 1 ) , y ( 1 ) ) , ⋯   , ( x ( m ) , y ( m ) ) } T=\{(x^{(1)},y^{(1)}),\cdots,(x^{(m)},y^{(m)})\} T={(x(1),y(1)),,(x(m),y(m))}
其中 x ( i ) ∈ R n , i = 1 , 2 , ⋯   , m x^{(i)}\in \mathbb{R}^n, i =1,2,\cdots,m x(i)Rn,i=1,2,,m, 表示数据集有 n n n 个 features. y ( i ) ∈ { 0 , 1 } , i = 1 , 2 , ⋯   , m y^{(i)}\in \{0,1\}, i =1,2,\cdots,m y(i){0,1},i=1,2,,m,代表0-1分类。
Logistic 回归的目的就是,已知 x x x,预测 x x x 对应的类别标签 y y y .

1.1 Logistic 回归模型结构

下面例子假设数据集有2个features n=2,则 x ( i ) ∈ { x ( 1 ) , x ( 2 ) } x^{(i)} \in \{x^{(1)},x^{(2)}\} x(i){x(1),x(2)}
则模型结构如下
请添加图片描述
即为:
Y ∗ = σ ( W T X + b ) Y^*=\sigma(W^{\rm T}X+b) Y=σ(WTX+b)
利用数据集理解该公式,即已知 x x x,得到 y = 1 y=1 y=1 的条件概率为 :
P ( 𝑦 = 1 ∣ 𝒙 ) = Y ∗ = σ ( W T X + b ) ∈ ( 0 , 1 ) P(𝑦 = 1|𝒙)=Y^*=\sigma(W^{\rm T}X+b) \in (0,1) P(y=1x)=Y=σ(WTX+b)(0,1)
则 Logistic回归的分类判别标准为:
P ( y ( i ) = 1 ∣ x ( i ) ) = 1 1 + e ( − w ⊤ x ( i ) − b ) P ( y ( i ) = 0 ∣ x ( i ) ) = e ( − w ⊤ x ( i ) − b ) 1 + e ( − w ⊤ x ( i ) − b ) P(y^{(i)}=1| x^{(i)})=\frac{1}{1+e^ {\left(-\boldsymbol{w}^{\top} \boldsymbol{x^{(i)}}-b\right)}} \\ P(y^{(i)}=0| x^{(i)})=\frac{e^ {\left(-\boldsymbol{w}^{\top} \boldsymbol{x^{(i)}}-b\right)}}{1+e^ {\left(-\boldsymbol{w}^{\top} \boldsymbol{x^{(i)}}-b\right)}} P(y(i)=1x(i))=1+e(wx(i)b)1P(y(i)=0x(i))=1+e(wx(i)b)e(wx(i)b)
选取概率最大的作为分类结果即可。

值得一提的是, Logistic 回归中, W 1 , W 2 W_1,W_2 W1,W2 对应着 X 1 , X 2 X_1,X_2 X1,X2 的乘子 ,但是 b b b对于 X 1 , X 2 X_1,X_2 X1,X2 是一个相等的实数,即 Z = [ W 1 W 2 ] [ X 1 X 2 ] T + b Z = [W_1 W_2][X_1X_2]^T+b Z=[W1W2][X1X2]T+b

  • b b b 仅仅为一个实数,而 W W W 是一个 ( 2 × 1 ) (2\times 1) (2×1)的向量
  • 对于参数可更新的模型,我们可以利用梯度下降算法优化参数 W W W b b b从而提升模型性能。

2. 为何说Logistic 回归为一个线性回归模型

判断一个模型是否线性,及判断其决策边界(decision boundary)是否为直线

Logistic 回归的决策边界定义为:
P ( y = 1 ∣ x ) P ( y = 0 ∣ x ) = 1 e ( − w ⊤ x ( i ) − b ) = 1 \frac{P(y=1|x)}{P(y=0|x)}=\frac{1}{e^ {\left(-\boldsymbol{w}^{\top} \boldsymbol{x^{(i)}}-b\right)}}=1 P(y=0x)P(y=1x)=e(wx(i)b)1=1
则边界为:
− w ⊤ x ( i ) − b = 0 -\boldsymbol{w}^{\top} \boldsymbol{x^{(i)}}-b = 0 wx(i)b=0
对于一个二分类 2 features 模型而言,其数据集分类图如下,请添加图片描述
可见其决策边界为线性,其模型是线性模型。

可以看出,当数据集线性可分时,Logistic 回归结果可能不错,但是数据集不可线性分割时,Logistic 回归可能不是最佳模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

JasonDean

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值