论文《CausalRec: Causal Inference for Visual Debiasing Visually-Aware Recommendation》阅读
论文概况
今天为大家带来的是 ACM MM 2021 上关于因果推荐的一篇论文《CausalRec: Causal Inference for Visual Debiasing Visually-Aware Recommendation》,论文主要聚焦在visually-based recommendation 这一主题,针对视觉特征造成的 visual bias, 基于因果推断,提出了基于因果干预的推荐模型 CausalRec。文章对于中介效应的介绍非常细致,值得学习。
论文由Queensland大学Ruihong Qiu(SBR 模型 FGNN 作者)完成
论文地址:https://dl.acm.org/doi/10.1145/3474085.3475266
代码地址:https://github.com/RuihongQiu/CausalRec
论文概述(Intro)
论文的动机来自于视觉bias,其实这里可以理解为clickbait,即处于视觉原因点击进入某个物体详情页,实际上用户对于该物品的prefence可能来自于其他原因(如品牌、价格、材质等)。
这里作者提出一个问题"If a user had seen other items with the same visual feature, would this user still interact with these items?"
这个问题也就引出了本文后续的反事实假设,这里所谓的the same visual feature,也就是因果干预(causal intervention),通过干预,使得物品的视觉信息相同(mean值处理或者null值处理)。
实际上个人认为,这里的假设其实是有点问题的,这部分内容后续进行详细解读。
Preliminaries
作者首先通过一个抽象的general的causal graph来解释 TE (Total Effect,总体效果)、 NDE (Natural Direct Effect)和 TIE (Total
Indirect Effect)。
作者这里通过一个泛化的因果图,来说明直接路径 (direct path)、间接路径 (indirect path)、中介(mediator)的概念和对因果图的影响。
对于上述图 2(a),存在路径 A → B A\rightarrow B A→B , A → C A\rightarrow C A→C , B → C B\rightarrow C B→C,分别表示三条因果路径。对于路径 A → B A\rightarrow B A→B, A A A 是 B B B 的 cause,即, A A A 能够决定 B B B 的分布。其余路径解释类似,节点表示变量,边表示因果关系。
对于节点 C C C,即存在路径 A → B → C A \rightarrow B \rightarrow C A→B→C,又存在路径 A → C A \rightarrow C A→C。如果研究对象是 A A A 对于 C C C 的影响,那么 A → B → C A \rightarrow B \rightarrow C A→B→C 就是一条间接路径, A → C A \rightarrow C A→C 就是一条直接路径。 B B B 就是一个中介,或 中间者(mediator)。
-
为调研不同路径对于结果 C C C 的影响,首先是不进行处理的因果图 2(a),那么得到的结果就是两条路径的总值,即 C a , B a C_{a, B_{a}} Ca,Ba。这里, B B B 的分布受到了 A A A 的影响,用贝叶斯公式来表示,即
P ( C ∣ A ) = ∑ b P ( C ∣ A , b ) P ( b ∣ A ) . (1) P(C \mid A)=\sum_b P(C \mid A, b) P(b \mid A). \tag{1} P(C∣A)=b∑P(C∣A,b)P(b∣A).(1) -
图 2(b) 表示对节点 a a a 进行干预,对两条边都有影响,得到最终的结果 C a ∗ , B a ∗ C_{a^{*}, B_{a^{*}}} Ca∗,Ba∗。 这两部分的差值,就可以体现对节点 A A A 进行干预,得到的所有变化效果,即,
T I E = C a , B a − C a ∗ , B a ∗ . (2) TIE = C_{a, B_{a}} - C_{a^{*}, B_{a^{*}}}. \tag{2} TIE=Ca,Ba−Ca∗,Ba∗.(2) -
想要探究不同路径对于结果的影响,就对单独的路径进行干预。以 图2© 为例,对直接路径进行干预,将 A A A 与 B B B 之间的路径切断,那么变量 B B B 就变成一个独立变量, A A A 与 B B B 之间的关系也就被切断了。根据贝叶斯公式,得到概率计算公式如下:
P ( C ∣ A ) = ∑ b P ( C ∣ A , b ) P ( b ) . (3) P(C \mid A)=\sum_b P(C \mid A, b) P(b). \tag{3} P(C∣A)=b∑P(C∣A,b)P(b).(3) -
图 2© 中,通过对直接路径进行干预,因此得到对变量 C C C 的直接影响 a ∗ a^{*} a∗。同时保留了原来的间接路径 A → B → C A \rightarrow B \rightarrow C A→B→C 的影响 B a B_{a} Ba,因此,对于结果变量 C C C,得到最终的计算结果为 C a ∗ , B a C_{a^{*}, B_{a}} Ca∗,Ba。
同理,对于图 2(d),得到 对间接路径的干预 结果 C a , B a ∗ C_{a, B_{a^{*}}} Ca,Ba∗。 -
由上引申,对于图 2(d),施加干预到间接路径,减去图 2(b) 的对源头节点 a ∗ a^{*} a∗ 的 影响,就得到了最终的直接路径上的影响变化,即自然直接效果(Natural Direct Effect,NDE):
N D E = C a , B a ∗ − C a ∗ , B a ∗ . (4) NDE = C_{a, B_{a^{*}}} - C_{a^{*}, B_{a^{*}}}. \tag{4} NDE=Ca,Ba∗−Ca∗,Ba∗.(4) -
根据 TE 和 NDE,得到 全部间接效果(Total Indirect Effect, TIE)的计算结果:
T I E = T E − N D E = C a , B a − C a , B a ∗ . (5) TIE = TE - NDE = C_{a, B_{a}} - C_{a, B_{a^{*}}}. \tag{5} TIE=TE−NDE=Ca,Ba−Ca,Ba∗.(5)
参考《关于中介效应的备忘》 一文,感谢 Jebda。
P.S. 另外,对于论文中的 treatment 和 no-treatment,不用刻意区分,这个表达目前没有在其他论文中见到过,按照因果推论中的期待值和目标值进行区分就行。即 A A A 只正常分布,未进行干预。 d o ( A = a ∗ ) do(A= a^{*}) do(A=a∗),即文中的no-treatment,只切断节点 A A A 的父节点,使之分布按照平均分布进行,不再受到父亲节点分布的影响。
可能作者这里重点强调treatment是赋值为某一特殊值,no-treatment是指去掉其特殊性,做均值或null值处理。
Visual Bias in Mainstream Visually-aware Recommendation
作者在这一部分介绍了主流的视觉推荐模型中的visual bias的情况,通过对不同模型(包括矩阵分解MF、VBPR、DeepStyle、AMR、DVBPR)进行对应到因果图的分析,对其bias进行了分析。
1. MF(UAI 2009)
y u , i = α + β u + β i + γ u ⊤ γ i . (6) y_{u,i} = \alpha + \beta_u + \beta_i + \boldsymbol{\gamma}_u^\top\boldsymbol{\gamma}_i. \tag{6} yu,i=α+βu+βi+γu⊤γi.(6)
对应因果图如 3(a), M M M 表示用户与物品之间的Match,即协同过滤关系,又同时通过bias term β u \beta_u βu, β i \beta_i βi