线性模型在经济流动性与房价建模中的应用
1. 多重线性模型拟合度评估
在评估多重线性模型的拟合度时,除了检查误差的标准差(SD),还可以通过多重线性模型的均方误差(MSE)与常数模型的MSE之比来衡量,这被称为多重 $R^2$,其定义为:
$R^2 = 1 - \frac{|y - X\hat{\theta}|^2}{|y - \bar{y}|^2}$
随着模型对数据的拟合程度越来越高,多重 $R^2$ 会趋近于 1。然而,这种方法存在问题,因为只要特征扩展了 $X$ 的张成空间,即使向模型中添加无意义的特征,$R^2$ 也会继续增加。为了考虑模型的大小,通常会根据模型中拟合系数的数量调整 $R^2$ 的分子和分母,即将分子除以 $1/[n - (p + 1)]$,分母除以 $1/(n - 1)$。
2. 美国经济流动性分析示例
2.1 数据来源与经济流动性衡量
美国被称为“机会之地”,经济学家 Raj Chetty 及其同事对美国的经济流动性进行了大规模数据分析。他们获取了 1980 - 1982 年出生在美国的所有人在 2011 - 2012 年的联邦所得税记录,以及他们父母在其出生年份的纳税记录。通过匹配父母 1980 - 1982 年将他们列为受抚养人的纳税记录,将 30 岁的人与他们的父母对应起来,数据集约有 1000 万人。
为了衡量经济流动性,Chetty 将 1980 - 1982 年父母收入处于第 25 百分位的特定地理区域出生的人进行分组,然后找出该组在 2011 年的平均收入百分位,这被称为平均绝对向上流动性(AUM)。如果一个地区的 AUM 为 25,意味着出生在第 25 百分位的人通常会
超级会员免费看
订阅专栏 解锁全文
400

被折叠的 条评论
为什么被折叠?



