监督学习 | 线性分类之Logistic回归原理及Sklearn实现

原创

于 2019-08-27 23:55:06 发布 · 1.5k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章目录

1. Logistic 回归
2. Sklearn 实现
参考资料

相关文章：

机器学习 | 目录

监督学习 | 线性回归之多元线性回归原理及Sklearn实现

监督学习 | 非线性回归之多项式回归原理及Sklearn实现

监督学习 | 线性回归之正则线性模型原理及Sklearn实现

1. Logistic 回归

我们之前讨论了如何用线性模型进行回归，但若要做的是分类问题怎么办？其实只需要找一个单调可微函数将分类任务的真实标记 $y$ 与线性回归模型的预测值 $z$ 联系起来。

考虑二分类任务，其输出标记 $y\in \{0,1\}$ ，而线性回归模型产生的预测值 $z=\boldsymbol{w}^T\boldsymbol{x}+b$ 是实值，于是，我们只需将实值 $z$ 转换为 0/1 值。最理想的是“单位阶跃函数”（unit-step function）：

$y=\left\{ \begin{aligned} &0, &\quad z<0\\ &0.5,&\quad z=0\\ &1,&\quad z>0 \end{aligned} \right.\tag{3}$

即若预测值 $z$ 大于零就判为正例，小于零就判为反例，预测值为临界值零则可任意判断，如下图所示：

图1 单位阶跃函数与对数几率函数

但如图所示，单位阶跃函数不连续，所以我们希望找到能在一定程度上近似单位阶跃函数的“替代函数”（surrogate function），并希望它单调可微，对数几率函数正是这样一个常用的替代函数。

1.1 Logistic 函数

对数几率函数（Logistic function）是一种“Sigmoid 函数”，它将 $z$ 值转化为接近 0 或 1 的 $y$ 值，并且其输出值在 $z = 0$ 附近变化很陡。

对数几率函数:
$f(z)=\frac{1}{1+e^{-z}} \tag{1}$

将 $z=\boldsymbol{w}^T\boldsymbol{x}+b$ 代入得：

$p=\frac{1}{1+e^{-(\boldsymbol{w}^T\boldsymbol{x}+b)}} \tag{2}$

移项并取对数得：

$ln(\frac{p}{1-p})=\boldsymbol{w}^T\boldsymbol{x}+b \tag{3}$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。