因果推断与自然语言处理
在自然语言处理(NLP)领域,因果推断正逐渐成为一个重要的研究方向。它有助于解决传统机器学习模型中存在的一些问题,如虚假相关性和缺乏泛化能力等。下面我们将深入探讨因果推断在NLP中的应用,包括因果阶梯框架、干预级去偏和反事实级去偏。
因果阶梯框架
Pearl提出的“因果阶梯”框架将因果关系分为三个层次,分别对应人类认知中的观察、行动和想象。
-
关联层(Association)
关联层指的是变量之间的统计相关性。许多机器学习模型都在这个层次上运行,学习条件概率分布 (P(Y = y | X = x))。然而,由于存在混淆变量,这些模型可能会推断出虚假的相关性。 -
干预层(Intervention)
干预层研究当变量 (X) 的值被操纵时,变量 (Y) 的值会如何变化。这涉及到Do - Calculus,用于计算 (P(Y = y | do(X = x))),即当 (X) 被干预为 (x) 时,(Y) 取值为 (y) 的概率。在执行 (do(X = x)) 操作后,混淆变量 (C) 对 (X) 的因果箭头 (C \to X) 被移除,相应机器学习模型的优化目标函数也应调整为 (P(Y = y | do(X = x)))。 -
反事实层(Counterfactual)
反事实层涉及对平行或假设世界的想象。在这个世界中,考虑现实世界中未发生的 ((X, Y)) 的反事实值 ((\tilde{x}, \tilde{y}))。例如
超级会员免费看
订阅专栏 解锁全文
1072

被折叠的 条评论
为什么被折叠?



