图上的因果推断:原理、方法与实验评估
1. 图上因果推断概述
图(即网络)是对现实世界中各种相互关联单元组成的系统进行建模的常用且不可或缺的工具,如社交网络、道路网络、协作网络、生物网络和知识图谱等。图的特性使我们能够更直观、高效地分析和理解这些复杂系统。近年来,图相关的学习和分析领域取得了显著进展,特别是在由先进图神经网络(GNNs)推动的高影响力领域。
然而,许多图学习方法仅捕捉了数据系统中变量之间的表面相关性,导致在现实应用中缺乏可信度。因此,理解数据系统中的因果关系至关重要。因果推断正是研究系统内部因果关系的学科,因果效应估计作为因果推断的主流研究任务之一,在图相关研究中起着关键作用。
例如,在物理接触网络中,要评估口罩要求政策在减轻 COVID - 19 传播方面的有效性,需要评估该政策对 COVID - 19 传播的因果效应,而不仅仅是它们之间的相关性。大多数传统因果效应估计研究依赖强假设,且专注于独立同分布(i.i.d.)数据,而图上的因果效应估计面临着许多独特的有效性障碍。但另一方面,图上的关系信息也能为因果推断带来额外的好处。图上因果推断的研究最近受到了广泛关注,在经济学、环境科学、医疗保健和推荐等多个领域有广泛应用。
2. 静态图上的因果效应估计
传统的因果效应估计研究大多基于强可忽略性假设(又称无混杂假设),该假设认为不存在未观察到的混杂因素(即隐藏混杂因素)。但在现实世界中,这一假设常常被违反。例如,在估计服药对人们健康的治疗效果时,每个人的社会经济地位可能是一个混杂因素,影响他们的用药选择和健康状况,而社会经济地位往往难以直接观察到。未观察到的混杂因素通常会导致因果效应估计出现偏差。
近年来
超级会员免费看
订阅专栏 解锁全文
685

被折叠的 条评论
为什么被折叠?



