机器学习（三）：逻辑回归之从理论到实践

最新推荐文章于 2024-02-01 16:42:35 发布

原创

最新推荐文章于 2024-02-01 16:42:35 发布 · 置顶 · 683 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文深入探讨逻辑回归的基本理论，包括Sigmoid函数、分类概率表示、梯度上升算法，以及如何用Python3实现逻辑回归算法。通过实例展示了如何在数据集上应用逻辑回归，解释了学习曲线和决策边界的绘制。

文中的代码和数据集下载地址：
https://github.com/TimePickerWang/MachineLearningInAction

一、基本理论

　　逻辑回归是一个二值型的分类器，它是利用Sigmoid函数来进行分类的，Sigmoid函数的表达式如下：

$g(z) = \frac{1}{1+e^{-z}}$

其函数图像如下图：
这里写图片描述
结合表达式可以知道：
$当z=0时，g(z)=0.5$
$当z>0时，g(z)>0.5$ ，且随着z的增大，g(z)会越来越接近1
$当z<0时，g(z)<0.5$ ，且随着z的减小，g(z)会越来越接近0

利用这一特性，我们可以进行这样一种分类方式：
当输入 $z>0.5$ 时，把样本分为1类
当输入 $z<0.5$ 时，把样本分为0类

那么 $z$ 具体是什么呢？假设每一个样本有n个特征：{ ${x_1,x_2,x_3......x_n}$ }，则：

z=w0x0+w1x1+w2x2+...+wnxn z = w 0 x 0 + w 1 x 1 + w 2 x 2 + . . . + w n x n $z=w_0x_0+w_1x_1+w_2x_2+...+w_nx_n$
　　
　　其中，

x0=1 x 0 = 1 $x_0=1$ 是一个常数，表示一个偏差量。

w0,w1,w2,...wn w 0 , w 1 , w 2 , . . . w n $w_0,w_1,w_2,...w_n$ 可以理解为每一个特征的权重，我们的目的就是寻求一组

w0,w1,w2,...wn w 0 , w 1 , w 2 , . . . w n $w_0,w_1,w_2,...w_n$ ，使得分类正确的概率尽可能的大。

　　那么问题来了，怎么表示分类正确的概率呢？假设有一个样本 $i$ ，其类标签是 $y(y=0或1)$ ，则可以利用上面提到的“ $g(z)$ ”表示样本 $i$ 为类1的概率，由于Sigmoid的值域为（０,１），所以可以令” $1-g(z)$ ”表示样本为类0的概率。则样本 $i$ 分类正确的概率可以表示如下：

p = g (z)^{y} (1 - g (z))^{1 - y}

$p=g(z)^y(1-g(z))^{1-y}$

上式中，当 $y=1$ 时， $p=g(z)$ ；当 $y=0$ 时， $p=1-g(z)$ 。所以无论样本

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。