机器学习笔记(V)线性模型(I)一维最小二乘法

本文介绍了线性模型的基本形式,详细解析了线性回归的概念及如何使用最小二乘法进行参数估计,通过数学推导展示了如何求解最优参数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基本形式

给定由d个属性描述的示例x=(x1;x2;;xd)其中xix在第i个属性上的取值,线性模型试图学得一个线性的组合来进行预测的函数
即:

f(x)=w1x1+w2x2++wdxd+b

向量形式为:

f(x)=wTx+b

其中w=(w1;w2;;wd)
wb学得之后模型就得以确定

线性回归

给定的数据集D={(x1,y1),(x2,y2),,(xm,ym)}
其中xi=(xi1;xi1;;xid),yiR
“线性回归”试图学得一个线性模型以尽可能准确地预测实值得输出标记。

最小二乘法

便于讨论考虑一种简单情况,输入属性的数目只有一个。
数据集为D={(xi,yi)}mi=1其中xiR
线性回归处理
f(xi)=wxi+b,使得f(xi)yi

均方误差:

E(f;D)=1mi=1m(f(xi)yi)2

让均方误差最小化

(w,b)=argmin(w,b)i1m(f(xi)yi)2=argmin(w,b)i1m(yiwxib)2

基于均方误差最小化来进行模型求解的方法称为“最小二乘法”(least square method)

最小二乘法的目的

试图找到一条直线,使得所有样本到直线上的欧式距离之和最小。
求解wb使得E(w,b)=mi=1(yiwxib)2最小化的过程,称为线性回归模型的最小二乘“参数估计”。
E(w,b)分别对wb求导,得到

E(w,b)wE(w,b)b=2(wi=1mx2ii=1m(yib)xi)=2(mbi=1m(yiwxi))

令上面的两个等式为零:
E(w,b)wE(w,b)b=0=0

于是有:
wi=1mx2ii=1m(yib)ximbi=1m(yiwxi)=0 (1)=0 (2)

由式(2)

b=1mi=1m(yiwxi) (3)

将式(3)代入式(1)得到
wi=1mx2ii=1m[yi1mj=1m(yjwxj)]xiwi=1mx2ii=1m[yi1mj=1m(yjwxj)]xiwi=1mx2ii=1m[xiyi1mxij=1m(yjwxj)]wi=1mx2ii=1mxiyii=1m1mxij=1myjj=1mwxjwi=1mx2ii=1mxiyii=1m1mxij=1myj1mwj=1mxj2=0=0=0=0=0

化简得到:
wi=1mx2iwj=1mxj2wwww=i=1mxiyii=1m1mxij=1myj=i=1mxiyii=1m1mxij=1myji=1mx2i1mw(j=1mxj)2=i=1mxiyii=1m1mxij=1myji=1mx2i1mw(j=1mxj)2=i=1mxiyii=1m1mxij=1myji=1mx2i1mw(j=1mxj)2=i=1myi(xix¯)i=1mx2i1mw(i=1mxi)2

其中x¯=1mi=1mxi
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值