线性回归

本文通过银行贷款金额预测的例子,详细介绍了线性回归的基本原理及其应用。解释了如何使用特征(如年龄和工资)来预测目标变量(银行贷款金额),并通过最小二乘法求解模型参数。

举个栗子

  • 数据:工资和年龄(2个特征)
  • 目标:预测银行会贷款给我多少钱(标签)
  • 考虑:工资和年龄都会影响最终银行贷款的结果,那么他们各自有多大的影响?(参数)

 

    

通俗解释

  • X1,X2就是我们的两个特征(年龄,工资),Y是银行最终会借给我们的钱
  • 找到一条最合适的线(想象一个高维)来最好的拟合我们的数据点

     

  假设Θ1是年龄的参数,Θ2是工资的参数

  拟合的平面:h0(x)=Θ01x12x2(Θ0是偏置项)

  整合:h0(x)=Σi=0nΘixiTx

误差

  真实值和预测值之间存在的差异(ε来表示该误差)

  对于每个样本:y(i)Tx(i)(i)                       (1)

  误差ε(i)是独立并且具有相同的分部,并且服从均值为0方差为Θ2的高斯分布

  在上例中,各个概念的含义:

  独立:张三和李四一起来贷款,他俩没关系

  同分布:他俩都来的是我们假定的这家银行

  高斯分布:银行可能会多给,也可能会少给,但是绝大多数情况下这个浮动不会太大,极小情  况浮动会比较大,符合正常情况。

  由于误差服从高斯分布:

                        (2)

 

  将(1)带入(2)式:

        

  似然函数:

        

    解释:什么样的参数跟我们的数据组合后恰好是真实值

  对数似然: 

        

    乘法难解,取对数转换为加法

  展开化简:

        

  目标:让似然函数(对数变换后也一样)越大越好
        (最小二乘法)

  目标函数:

        

  求偏导:

      

  偏导等于0:

       

评估方法

  最常用的评估项

        

  R2的取值越接近于1我们认为模型拟合的越好

 

 

 

  

 

  

 

转载于:https://www.cnblogs.com/hellojack/p/7755933.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值