机器学习实战-Logisitic回归

本文深入探讨Logistic回归,介绍了基于最优化的梯度上升法和梯度下降法确定最佳回归系数,并详细阐述了Logistic回归的代码实现,包括梯度上升优化算法、数据可视化和分类测试,展示了在实际数据集上的应用效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

一、Logistic回归

基于最优化方法的最佳回归系数确定

梯度上升法

梯度下降法

二、代码实现

1.logistic回归梯度上升优化算法

2.画出数据集和logistic回归最佳拟合直线的函数

3.随机梯度上升算法

4.改进的随机梯度上升算法

5.测试算法:用logistic回归进行分类



一、Logistic回归

logistic回归的优点:计算代价不高,易于理解和实现。缺点:容易欠拟合,分类精度可能不高。适用数据类型:数值型和标称型数据。

一个常用的逻辑函数为Sigmoid函数,公式为,其图像为

 上图给出了sigmoid函数在不同坐标尺度下的两条曲线图。当x为0时,sigmoid函数值为0.5。随着x的增大,对应的sigmoid函数的值将逼近于1;而随着x的减小,sigmoid函数的值将逼近于0。而第二幅图中我们能看到在横坐标的刻度足够大是,在x=0处sigmoid函数看起来很像阶跃函数。
为了实现logistic回归分类器,我们可以在每个特征上都乘以一个回归系数,然后把所有的结果值相加,将这个总和带入sigmoid函数中。进而得到一个范围在0-1之间的数值。任何大于0.5的数据被分入1类,小于0.5即被分入0类。所以,logistic回归也可以看所是一种概率估计。

基于最优化方法的最佳回归系数确定

sigmoid函数的输入记为z,有下面公式得出:

 根据向量的写法,上述公式写成x是分类器的输入数据,向量w就是我们要找的最佳参数(系数),为了寻找最优化w值,还需要用到最优化理论。

梯度上升法

梯度上升法思想是:要找到某个函数的最大值,最好的方法是沿着该函数的梯度方向寻找。如果梯度记为,则函数f(x,y)的梯度由下式表示:

这个梯度意味着沿x方向移动 ,沿着y的方向移动。其中,函数f(x,y)必须要在待计算的点上有定义并可微。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值