因果推断与机器学习:深入探索反事实解释与深度学习应用
1. 反事实解释的引入
想象你向银行申请贷款,自认为准备充分,信用评分等各方面都没问题,申请肯定能通过。然而周三早上收到银行邮件,打开却发现贷款申请被拒。你致电银行询问原因,客服仅告知未满足标准,却无法给出具体是哪些标准,也没人能告诉你下次申请如何改进。
这种情况并非一定是银行员工不愿帮忙,可能是组织在技术上还无法回答此类问题。我们可以回顾S - Learner的原理,先在数据上训练单个模型,然后针对处理变量的不同值生成预测并做简单减法。这个思路很灵活,若将其扩展到之前未作为处理变量的其他变量,理论上可能会破坏模型的因果特性,但如果我们的目标是改变模型输出,关注模型行为而非其对潜在过程的准确表示,这种干预就能提供有效结果。
不过,这种方法也存在挑战。比如特征间存在交互作用时,可能需要改变多个特征才能影响结果;或者有多种改变结果的方式,却只找到了最难的那种。为解决这些问题,微软发布了开源包Diverse Counterfactual Explanations(DiCE)。DiCE会搜索输入特征的一组变化,以实现结果改变,同时最大化与原始值的接近度和多样性,让我们能选择最佳解决方案。
在某些行业和地区,由于特定监管要求,之前讨论的方法可能难以应用,而DiCE提供了一套在处理敏感数据时很有用的工具。在因可解释性要求难以应用复杂机器学习模型的情况下,也可以用简单线性模型实现类似逻辑。
2. 深度学习在异质处理效应中的应用
自2010年代初现代深度学习兴起以来,取得了一系列突破,如AlexNet革新计算机视觉,Word2vec改变自然语言处理(NLP)面貌,Transfor
超级会员免费看
订阅专栏 解锁全文
1251

被折叠的 条评论
为什么被折叠?



