逻辑回归为什么要用sigmoid函数

本文从普通线性模型与广义线性模型的角度出发,探讨逻辑回归的起源。通过广义线性模型的指数簇分布和伯努利分布的推导,揭示了逻辑回归为何使用sigmoid函数作为联系函数,其在二分类问题中的重要性得以显现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这个问题我们要从普通线性模型与广义线性模型开始讲起,看官不要着急,慢慢的往下看。

普通线性模型与广义线性模型

普通线性模型是用模型的预测值去逼近真实标记y:

Y=ω1x1+ω2x2+ω3x3+ω4x4+...+ωpxp+bY = \omega_{1}x_1 + \omega_{2}x_2 + \omega_{3}x_3 + \omega_{4}x_4 +... + \omega_{p}x_{p}+bY=ω1x1+ω2x2+ω3x3+ω4x4+...+ωpxp+b

Y=ωTx+bY = \omega^Tx+bY=ωTx+b

而如果我们令预测值去逼近y的衍生物,我们就得到了广义线性模型。

g(Y)=ωTx+bg\left(Y\right) = \omega^Tx+bg(Y)=ωTx+b

考虑单调可微函数g,有如上广义线性模型,其中函数g称为“联系函数”(link function)。

普通线性模型

普通线性模型 (ordinary linear model) 可以用下式表示:
Y=β0+β1x1+β2x2+β3x3+β4x4+...+βp−1xp−1+ϵY = \beta_{0} + \beta_{1}x_1 + \beta_{2}x_2 + \beta_{3}x_3 + \beta_{4}x_4 +... + \beta_{p-1}x_{p-1}+\epsilonY=β0+β1x1+β2x2+β3x3+β4x4+...+βp1xp1+ϵ

普通线性模型的假设主要有以下几点:

  1. 响应变量YYY和误差项ϵ\epsilonϵ正态性:响应变量YYY和误差项ϵ\epsilonϵ服从正态分布,且ϵ\epsilonϵ是一个白噪声过程,因而具有零均值,同方差的特性
  2. 预测量xix_ixi
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值