机器学习实战-Logisitic回归

最新推荐文章于 2024-05-31 09:00:00 发布

Rouger7921

最新推荐文章于 2024-05-31 09:00:00 发布

阅读量1.4k

点赞数

CC 4.0 BY-SA版权

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Rouger7921/article/details/121454181

本文深入探讨Logistic回归，介绍了基于最优化的梯度上升法和梯度下降法确定最佳回归系数，并详细阐述了Logistic回归的代码实现，包括梯度上升优化算法、数据可视化和分类测试，展示了在实际数据集上的应用效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

一、Logistic回归

基于最优化方法的最佳回归系数确定

梯度上升法

梯度下降法

二、代码实现

1.logistic回归梯度上升优化算法

2.画出数据集和logistic回归最佳拟合直线的函数

3.随机梯度上升算法

4.改进的随机梯度上升算法

5.测试算法：用logistic回归进行分类

一、Logistic回归

logistic回归的优点：计算代价不高，易于理解和实现。缺点：容易欠拟合，分类精度可能不高。适用数据类型：数值型和标称型数据。

一个常用的逻辑函数为Sigmoid函数，公式为，其图像为

上图给出了sigmoid函数在不同坐标尺度下的两条曲线图。当x为0时，sigmoid函数值为0.5。随着x的增大，对应的sigmoid函数的值将逼近于1；而随着x的减小，sigmoid函数的值将逼近于0。而第二幅图中我们能看到在横坐标的刻度足够大是，在x=0处sigmoid函数看起来很像阶跃函数。
为了实现logistic回归分类器，我们可以在每个特征上都乘以一个回归系数，然后把所有的结果值相加，将这个总和带入sigmoid函数中。进而得到一个范围在0-1之间的数值。任何大于0.5的数据被分入1类，小于0.5即被分入0类。所以，logistic回归也可以看所是一种概率估计。

基于最优化方法的最佳回归系数确定

sigmoid函数的输入记为z，有下面公式得出：

根据向量的写法，上述公式写成x是分类器的输入数据，向量w就是我们要找的最佳参数（系数），为了寻找最优化w值，还需要用到最优化理论。

梯度上升法

梯度上升法思想是：要找到某个函数的最大值，最好的方法是沿着该函数的梯度方向寻找。如果梯度记为，则函数f(x,y)的梯度由下式表示：

这个梯度意味着沿x方向移动，沿着y的方向移动。其中，函数f(x,y)必须要在待计算的点上有定义并可微。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。