我们有n个样本xi,i∈{ 1,2,⋯,n},并且我们知道每个样本对应的输出值yi,i∈{ 1,2,⋯,n}。我们希望能够
Find f(⋅) s.t. yi=f(xi)
这样每当有一个新的观测
x
到来,我们便可通过函数
能够在已有所有样本上,使yi严格等于f(xi)的函数f(⋅)的预测效果并不一定那么好。因为
- xi中很可能未包含所有影响yi值的特征。
- xi观测到的值很可能有观测误差。
所以,我们转而
Find f(⋅) s.t. yi=f(xi)+εi
其中
εi
是随机噪声。
多元线性回归模型就是在做一些假设基础上,利用所有样本数据 xi 来找到一个最优的 f(⋅) 。
假设
- yi=θTxi+εi,也就是要找到最优的f(⋅),只要确定最优的θ就好了。
- 噪声εi∼N(0,δ2)。
- εi独立同分布。
从假设2中我们可得到
yi|xi;θ∼N(θTxi,δ2)
又根据假设3,我们可以使用最大似然法确定最优的 θ :
maxmize L(θ)=∏12π−−√σe(−(

本文详细介绍了多元线性回归模型,包括模型假设、确定最优参数θ的梯度下降法和随机梯度下降法,以及正则化、局部加权回归等优化策略。此外,还提供了matlab代码实现。
最低0.47元/天 解锁文章
486

被折叠的 条评论
为什么被折叠?



