倾向值匹配(PSM)指南

为什么要倾向值匹配?

样本选择偏误会带来内生性问题:
比如在比较读研究生对于工资的影响时,要选择能力、智商、家庭背景、工作单位等都差不多的样本进行比较,所以需要样本匹配.

样本匹配的核心

  1. 共同支撑假设
    在这里插入图片描述
  2. 平行假设
    在这里插入图片描述

方法与举例

小明读研究生和没读研究生的工资差距多少?
这是一个反事实问题,因为事实上他已经读了
使用倾向值匹配,从一大堆没读研究生的人(样本子集)中,对每个人读研究生的概率进行估计(logistic回归),找到与小明有差不多读研概率但没读的小强,作为小明的对照。

步骤

对总体样本进行 logit 或 probit 回归
估计出每一个观测对象读研的概率
根据读研概率,把读研的和没读研的配对起来,得到实验组和对比组

++++++++++以下为stata实现+++++++++++++++++

# probit 回归
probit [dependent var] [independent var]
# [dependent var] 是01变量
# [independent var] 是普通变量
# 根据 probit 模型计算出每个样本的读研概率
predict pscore, p
# pscore 是纪律每个观测对象读研概率的变量
倾向值匹配
psma
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值