一般回归问题、线性回归与模型的正确设定

本文首先介绍了回归问题的基本概念和均方误作为评估预测效果的指标,指出最佳预测函数即条件期望。然后,阐述了线性回归模型,包括仿射函数和最优线性最小二乘预测,并探讨了线性回归模型与最优线性最小二乘预测之间的关系。最后,讨论了线性回归模型的正确设定条件及其重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 一般回归问题

一般来说,计量经济学教材会从线性回归讲起,但这里再在线性回归之前,理一理更一般性的回归问题。

先看定义一下什么叫回归:

定义1 回归函数(Regression Function):E(y∣x)\mathbb{E}(y|\mathbf{x})E(yx)就是yyyx\mathbf{x}x的回归函数。

再定义一个度量预测得好不好的指标:

定义2 均方误(Mean Squared Error,MSE):假设用g(x)g(\mathbf{x})g(x)预测yyy,则预测量g(x)g(\mathbf{x})g(x)的均方误为 MSE(g)=E[y−g(x)]2\text{MSE}(g)=\mathbb{E}[y-g(\mathbf{x})]^2MSE(g)=E[yg(x)]2

最好的预测函数的形式是什么?以下定理表明,最好的预测函数,恰恰就是回归函数即条件期望。

定理1 MSE的最优解:E(y∣x)\mathbb{E}(y|\mathbf{x})E(yx)是以下问题的最优解:
E(y∣x)=arg⁡min⁡g∈FMSE(g)=arg⁡min⁡g∈FE[y−g(x)]2 \mathbb{E}(y|\mathbf{x}) = \arg\min_{g\in \mathbb{F}} \text{MSE}(g) = \arg\min_{g\in \mathbb{F}} \mathbb{E}[y-g(\mathbf{x})]^2 E(yx)=arggFminMSE(g)=arggFminE[yg(x)]2
其中F\mathbb{F}F是所有可测和平方可积函数的集合(space of all measurable and square-integrable functions):
F={ g:Rk+1→R∣∫g2(x)fX(x) dx<∞} \mathbb{F}=\{ g:\mathbb{R}^{k+1}\to\mathbb{R} \Big| \int g^2(\mathbf{x})f_X(\mathbf{x})\,d\mathbf{x}<\infty\} F={ g:Rk+1Rg2(x)fX(x)dx<}

在该定理中,直接求解最值问题比较复杂,需要用到变分法,用构造法证明该定理比较简单,直接对MSE(g)\text{MSE}(g)MSE(g)做分解即可。令g0(x)≡E(y∣x)g_0(\mathbf{x})\equiv \mathbb{E}(y|\mathbf{x})g0(x)E(yx),则有
MSE(g)=E[y−g0(x)+g0(x)−g(x)]2=E[y−g0(x)]2+E[g0(x)−g(x)]2+2E[(y−g0(x))(g0(x)−g(x))]2=E[y−g0(x)]2+E[g0(x)−g(x)]2 \begin{aligned} \text{MSE}(g) = &\mathbb{E}[y-g_0(\mathbf{x})+g_0(\mathbf{x})-g(\mathbf{x})]^2\\ =& \mathbb{E}[y-g_0(\mathbf{x})]^2+\mathbb{E}[g_0(\mathbf{x})-g(\mathbf{x})]^2+2\mathbb{E}[\left(y-g_0(\mathbf{x})\right)\left(g_0(\mathbf{x})-g(\mathbf{x})\right)]^2\\ =& \mathbb{E}[y-g_0(\mathbf{x})]^2+\mathbb{E}[g_0(\mathbf{x})-g(\mathbf{x})]^2 \end{aligned} MSE(g)===E[yg0(x)+g0(x)g(x)]2E[yg0(x)]2+E[g0(x)g(x)]2+2E[(yg0(x))(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值