参考陈强老师的《计量经济学及Stata应用》视频及书籍
Part2学习内容:
(一元线性回归)
4.1一元线性回归模型
-
劳动经济学中的明瑟方程
lnw=α+βs+ϵln w=\alpha+\beta s+\epsilonlnw=α+βs+ϵ -
一元线性回归模型
yi=α+βxi+ϵy_i=\alpha+\beta x_i+\epsilonyi=α+βxi+ϵ -
lnwln wlnw:被解释变量(dependent variable, regressand)
-
xix_ixi:解释变量(explanatory variable, independentvariable, regressor)
-
α\alphaα:截距项(intercept)或常数项(constant)
-
β\betaβ:斜率(slope)
-
α与β\alpha 与\betaα与β:统称为“回归系数”(regression coefficients)或“参数”(parameters)
-
ϵ\epsilonϵ:误差项(error term)或扰动项(disturbance),包括遗漏的其它因素、变量的测量误差、回归函数的设定误差(忽略了非线性项)以及人类行为的内在随机性等
该模型也叫数据生成过程(Data Generation Process)
4.2 OLS估计量的推导
- 普通最小二乘法(Ordinary Least Squares,简称OLS)就是选择参数,使残差平方和(Sum of Squared Residuals,简称SSR或RSS)最小化
- 正规方程组(normal equations)
- 样本回归线(sample regression line)或样本回归函数(sample regression function)
4.3 OLS的正交性
4.4 平方和分解公式
TSS=ESS+RSSTSS=ESS+RSSTSS=ESS+RSS
TSSTSSTSS:Total Sum of Squares
ESSESSESS:Explained Sum of Squares
RSSRSSRSS:Residual Sum of Squares
其中部分证明原理涉及到OLS的正交性
4.5 拟合优度
- 拟合优度R2R^2R2也称为可决系数(coefficient of determination)
- R2R^2R2越高,样本回归线对数据的拟合程度越好
- 评估回归方程是否显著,应使用F检验
4.6 无常数项的回归
4.7 一元回归的Stata实例
4.8 Stata命令运行结果的存储与调用
4.9 总体回归函数与样本回归函数:蒙特卡洛模拟
- 蒙特卡洛模拟:指通过计算机模拟,从总体抽取大量随机样本的计算方法