一、线性回归模型概述
- 线性回归模型:简单的来说就是在样本空间中的一条直线或者一个平面或者更高维的超平面,并且我们要使得预测值与真实值之间的误差最小化。
- 三维样本空间如下图:
- 二维样本空间:
二、线性回归模型
-
给定训练集D=(x1,y1),(x2,y2),…,(xn,yn)D={(x_1,y_1 ),(x_2,y_2 ),…,(x_n,y_n)}D=(x1,y1),(x2,y2),…,(xn,yn)其中xi∈Rd;y∈R;x_i∈R^d;y∈R;xi∈Rd;y∈R;线性回归模型如下:f(xi)=wTxi+bf(x_i )=w^T x_i+bf(xi)=wTxi+b并且我们期望得到的模型有下面式子成立:f(xi)≈yif(x_i )≈y_if(xi)≈yi
-
为便于讨论我们将将bbb并入到www中:xi=[xi1,xi2,…,xid,1]Tx_i=[x_i^1,x_i^2,…,x_i^d,1]^T xi=[xi1,xi2,…,xid,1]Twi=[wi1,wi2,…,wid,b]Tw_i=[w_i^1,w_i^2,…,w_i^d,b]^Twi=[wi1,wi2,…,wid,b]T所以线性回归模型可以表示为:f(xi)=wTxif(x_i )=w^T x_if(xi)=wTxi
-
我们将每个样本的预测值与真实值记为:εiε_iεi yi=wTxi+εiy_i=w^T x_i+ε_iyi=wTxi+εi
-
假设误差εiε_iεi是独立同分布的,并且服从高斯分布。即:P(εi)=12πσexp(−εi22σ2)P(ε_i )=\frac{1}{\sqrt{2πσ}} exp(-\frac{ε_i^2}{2σ^2 })P(εi)=2πσ1exp(−2σ2εi2)εi=yi−xiε_i=y_i-x_iεi=yi−xi带入得到:P(yi∣xi,w)=12πσexp(−(yi−wTxi)22σ2)P(y_i |x_i,w)=\frac{1}{\sqrt{2πσ}} exp(-\frac{(y_i-w^T x_i)^2}{2σ^2 })P(yi∣xi,w)=2πσ1exp(−2σ2(yi−wTxi)2)已知参数www和数据xix_ixi的情况下,预测值为yiy_iyi的条件概率.
-
注:这个地方个人感觉比较疑惑:P(εi)P(ε_i )P