总结:
受试者效应(实验组效果)的可靠性,会受到样本不能完全代表总体的这个条件限制的影响。
也就是说不可能对所有样本做试验,也不可能保证样本的分布与总体分布一定一致,因为总体分布通常不可知。
保证效果可靠关键是要保证随机性,或者说,实验组与对照组足够相似。
有些什么方法呢:
1、匹配。
一是根据协方差相似度匹配。
二是PSM,倾向性得分匹配。
对每个样本计算出现的概率,就是所谓倾向性得分,是在给定样本特征X时,不同样本接受处理的条件概率。很像先验。基于倾向得分估计值对样本进行匹配后估计因果效应?这样能行?
2、断点回归
3、双重差分
4、合成控制。
本文探讨了在机器学习中进行因果推断时,如何保证受试者效应的可靠性。由于样本不完全代表总体且总体分布通常未知,随机性成为关键。文章介绍了几种方法,如匹配(协方差相似度匹配和倾向性得分匹配)、断点回归、双重差分以及合成控制,来处理这个问题。这些技术旨在确保实验组与对照组的相似性,从而更准确地估计因果效应。
1249

被折叠的 条评论
为什么被折叠?



