倾向匹配得分模型 PSM 及 Stata 具体操作步骤

最新推荐文章于 2025-06-25 10:29:53 发布

数据博士

最新推荐文章于 2025-06-25 10:29:53 发布

阅读量2w

点赞数 30

CC 4.0 BY-SA版权

分类专栏： Stata实证操作文章标签：人工智能机器学习深度学习回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/a519573917/article/details/141266125

目录

二、文献综述

三、理论原理

四、实证模型

五、程序代码及解释

六、代码运行结果

七、稳健性检验

一、引言

倾向匹配得分模型（Propensity Score Matching，PSM）是一种在观察性研究中用于减少选择偏差的常用方法。通过估计个体接受某种处理（例如参与某个项目、接受某种治疗等）的概率，即倾向得分，然后基于倾向得分对处理组和对照组进行匹配，以构建类似于随机实验的样本，从而使得处理组和对照组在可观测特征上具有可比性。

二、文献综述

在社会科学和医学研究等领域，PSM 方法得到了广泛的应用。Rosenbaum 和 Rubin（1983）首次提出了倾向得分匹配的概念和方法，为后续的研究奠定了基础。他们指出，通过倾向得分进行匹配，可以有效地控制观察性研究中的混杂因素，从而更准确地评估处理效应。

例如，Smith 和 Todd（2005）在研究教育政策对学生成绩的影响时，运用 PSM 方法来解决样本选择偏差问题，使得研究结果更具可靠性。Athey 和 Imbens（2006）则在处理经济数据时，采用 PSM 方法来评估政策干预的效果，为政策制定提供了有力的依据。

此外，Hirano 和 Imbens（2001）对 PSM 的理论和应用进行了深入的探讨，进一步完善了该方法的理论框架。在医学领域，Austin（2011）等人利用 PSM 方法评估了不同医疗治疗方案的效果，为临床决策提供了重要的参考。

这些研究都充分展示了 PSM 方法在解决观察性研究中选择偏差问题的有效性和实用性。

三、理论原理

倾向匹配得分模型（PSM）的理论基础建立在反事实框架和条件独立性假设之上。

在观察性研究中，我们通常将个体分为处理组（接受了某种处理或干预）和对照组（未接受处理或干预）。然而，由于个体并非随机分配到处理组和对照组的，可能存在一些混杂因素导致两组个体在特征上存在系统性差异，从而影响对处理效应的准确评估。

四、实证模型

估计倾向得分
- 通常采用 Logistic 回归或 Probit 回归来估计倾向得分。假设处理变量为 Treatment，协变量为 X1、X2、... 、Xn，则 Logistic 回归模型可以表示为：

    logit Treatment X1 X2... Xn

或者 Probit 回归模型表示为：

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。