一、引言:什么是倾向得分匹配?
倾向得分匹配(Propensity Score Matching,PSM)是观察性研究中常用的一种因果推断方法,旨在通过构建“反事实框架”来模拟随机对照试验,从而减少混杂变量对处理效应估计的偏差。SPSSAU作为一款智能在线统计分析平台,为用户提供了简洁高效的PSM分析模块,支持多种匹配方法与输出指标,助力研究者实现更科学的因果推断。
二、PSM分析流程图:从数据准备到效应估计
下面我们通过一个Mermaid流程图来展示SPSSAU中PSM分析的完整步骤:

流程说明:首先,用户需在SPSSAU中导入原始数据,并设置匹配方法、匹配比例、抽样方式等参数。系统基于Logit模型估计倾向得分,并执行匹配算法。匹配成功后,进行平行假设检验以评估匹配质量,最后计算平均处理效应(ATT),并输出匹配后的样本数据,供后续因果分析使用。
二、PSM分析的核心参数与设定

1. 匹配方式
SPSSAU 支持 1:1匹配 与 1:多匹配。
- 1:1匹配:每个实验组个体仅与一个最相似的控制组个体匹配;
- 1:多匹配:可以提升估计精度,但会降低样本独立性。
2. 匹配方法
SPSSAU 提供了多种匹配策略:
- 最近邻匹配法:寻找倾向得分最接近的样本;
- 半径匹配法(Radius Matching):设定“卡尺半径”(如0.01),在该范围内寻找控制组样本,若无匹配对象则舍弃。半径匹配能在严格匹配与样本利用之间取得平衡。
3. 抽样方法
SPSSAU 允许选择:
- 放回抽样:控制组样本可以重复使用;
- 不放回抽样:每个控制组样本只能匹配一次。
这一步影响了匹配的稳定性与结果代表性。
4. 可保存信息
匹配完成后,SPSSAU 可输出四项关键数据:
- Id 与 MatchId:展示匹配关系;
- Weight:匹配成功次数;
- PScore:倾向得分(Logit 模型估计值)。
这些信息可直接导出,用于后续分析或模型验证。SPSSAU进行倾向得分匹配法操作示例如下:

三、平行假设检验:检验匹配是否成功

- 理论解释:平行假设检验的核心是判断:匹配后实验组与控制组在协变量上是否平衡。即除了处理变量外,其他条件应趋于一致。
- 关键指标:
- 标准化偏差(Standardized Bias):衡量实验组与控制组在协变量上的均值差异占标准差的比例。一般认为匹配后偏差 < 20% 即可接受。偏差减少幅度越大,说明匹配效果越好。
- t检验与p值:若匹配后 t检验不显著(p > 0.05),说明实验组与控制组在协变量上无显著差异,匹配成功。
- SPSSAU 的智能解读:SPSSAU 在输出报告中会自动解释匹配质量,若“匹配前显著、匹配后不显著”,则匹配有效;若标准化偏差显著下降,则匹配平衡性良好。SPSSAU输出PSM平行假设检验结果示例如下:

四、ATT效应分析:检验“处理”的真实影响

理论解释:ATT(Average Treatment effect on the Treated)即“对实验组的平均处理效应”,衡量在匹配平衡后,实验组与控制组在结果变量上的平均差异。
计算公式为:ATT=E[Y1−Y0∣D=1]
其中,Y1为接受处理的结果,Y0为未处理的假想结果。PSM 通过匹配估计Y0。
指标解释:
- Difference / ATT效应值:实验组与控制组的均值差;
- Std. Error:标准误,用于计算 t 值;
- t 值、p 值:检验差异是否显著。若 p < 0.05,则认为处理变量对结果变量具有显著影响。
SPSSAU输出ATT效应分析结果示例如下:

五、指标间的逻辑关联:如何系统评估匹配效果?
PSM分析不是一个孤立的步骤,而是一个多阶段、多指标联动的过程。下面我们通过一个综合图示来展示各指标之间的逻辑关系:

关联性解读:
- 匹配参数决定匹配成功率:例如,放宽半径值或使用放回抽样通常会提高匹配成功比例。
- 匹配成功率影响平行假设:若匹配成功比例低,则协变量平衡难度增大,标准化偏差可能偏高。
- 平行假设检验决定ATT有效性:只有通过平行假设检验(即匹配后组间平衡),ATT估计才具有因果解释力。
- ATT结果需结合标准误与p值:即使ATT值较大,若标准误高或p值不显著,仍不能认为处理效应存在。
六、共同支撑检验
共同支撑检验可通过SPSSAU中的核密度图进行检验,其原理在于对比匹配前和匹配后的倾向得分值pscore分布情况变化。共分为4步。
第1步:得到pscore值,在SPSSAU倾向得分匹配时选中‘输出信息’可得到;
第2步:针对匹配前的pscore绘制核密度图,查看控制组和实验组的核密度图(即X放入实验组别项),控制组和实验组分布应该差异较大;
第3步:针对匹配后的pscore绘制核密度图(筛选出匹配成功次数weight>0后再分析),查看控制组和实验组的核密度图,控制组和实验组分布应该差异较小。
第4步:如果匹配前控制组和实验组分布差别较大,但匹配后控制组和实验组分布差别较小,则说明满足‘共同支撑检验’。
七、总结与拓展
倾向得分匹配法是通过对样本建模(logit模型)得到Pscore值,通过Pscore值为处理组在控制组中找到最接近的样本,从而进行研究的。
PSM的优点在于可以控制干扰因素的影响、提高研究的证明力度;但其缺点也不可忽视,例如PSM需要样本量大、可能并非所有样本都能匹配成功,所以导致匹配后引起的样本量的损失问题不能忽视,甚至无法确定匹配后的样本是否能代表原有研究样本。
114

被折叠的 条评论
为什么被折叠?



