机器学习——logistic回归

 

目录

一、什么是Logistic回归?

        1.基本概念

        2.使用Logistic回归处理数据分析 

 二、Logistic回归的步骤

1.构造预测函数

2.使损失函数最小并求得回归参数

三、代码实现 

1.准备数据集:100个数据量

2.读取文件

 3.求出回归参数并画出决策边界

 4.随机梯度上升

 5.改进版随机梯度上升

6.完整代码

 四、总结

1.Logistic回归的主要用途 

2.当模型效果不理想的时候,可调整的策略有


一、什么是Logistic回归?

       1.基本概念

它实际上是一种分类方法,主要用于两分类问题(即输出只有两种,分别代表两个类别),通过给定的n组数据(训练集)来训练模型,并在训练结束后对给定的一组或多组数据(测试集)进行分类。其中每一组数据都是由p 个指标构成。

      2.使用Logistic回归处理数据分析 

  假设有3个指标(工资,年龄,可贷款金额),然后需要根据工资和年龄来判断这个人的可贷款金额大概是多少。

工资 年龄 可贷款金额
4000 26 20000
8000 36 70000
12000 46 85000

假设以工资为x1轴,年龄为x2轴,可贷款金额为Y轴,可以建立一个3维的空间点

 二、Logistic回归的步骤

1.构造预测函数

由于线性回归的输出值域为负无穷到正无穷,不能直接应用于分类,可以构造一个sigmoid()函数,将大于0的值映射为1,小于0的值映射为0,这样我们就可以达到分类的目的。

首先线性回归模型可以为:z=w^{T}x+b ,然后对回归值进行变换:y=g(z)=g(w^{T}+b)

得到对数几率函数:g(z)=\frac{1}{1+e^{-z}}=\frac{1}{1+e^{-(w^{T}x+b)}},将z值转化为一个接近0或1的y值,且当z值远离0时,y值迅速靠近0或1。

p(y=1|x)=\frac{e^{w^{T}x+b}}{1+e^{w^{T}x+b}}

p(y=0|x)=\frac{1}{1+e^{w^{T}x+b}}

代码如下

import matplotlib.pyplot as plt
import numpy as np

def sigmoid(z):
    return 1.0 / (1.0 + np.exp(-z))

z = np.arange(-6, 6, 0.05)
plt.plot(z, sigmoid(z))
plt.axvline(0.0, color='k')
plt.axhline(y=0.0, ls='dotted', color='k')
plt.axhline(y=1.0, ls='dotted', color='k')
plt.axhline(y=0.5, ls='dotted', color='k')
plt.yticks([0.0, 0.5, 1.0])
plt.ylim(-0.1, 1.1)
plt.show()

 结果如下:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值