论文《Causal Inference for Recommender Systems》阅读

论文概况

今天给大家带来的是发表在推荐系统顶会 RecSys 2020 上的文章《Causal Inference for Recommender Systems》,文章聚焦 推荐系统中 曝光 (exposure) 和 评分(rating)之间的偏差问题,通过因果推断,完成了模型 Deconfounded Recommder

论文动机(Introduction)

在 Intro 部分,作者着重强调了当前主流推荐系统的不合理的地方,即
推荐系统推荐的核心是:用户看了电影以后会如何评分? 但这实际上是不经济不合理的,因为实际上应该给用户推荐的是用户没看过但是想去看的物品。

作者形象地将这一问题比喻为临床试验,相当于随机地给患者(用户)进行诊断(电影的曝光),然后要求患者对诊断给出反应(评分)。

这一现象的核心在于,一般用户看电影是有目的去看的,那么根据用户看过的电影的评分去判断用户喜好这一行为本身就是存在bias的。驱使用户去看某一点用的出发点,可能是电影导演,可能是电影类型,更多情况下,可能是没法儿测量的。

针对上述问题,作者提出了 deconfounded recommender模型,基于矩阵分解模型去除 unobserved confounder 。作者首先将作者对物品的交互分成两步:(1)曝光 exposure;(2)评分 rating。
由于用户只能对看过的电影进行打分,即评分这一行为是有偏的,这一行为将 exposure 和 rating 耦合在一起。后续的操作也是根据这两个步骤具体进行操作的。

Methodology

Preliminaries

作者使用 a u i a_{ui} aui 作者是否用户对物品进行了评分, y u i ( 1 ) y_{ui}(1) yui(1) 用于表示 用户 u u u 在看过 电影 i i i 的情况下给出的评分( y u i ( 1 ) ≠ 0 y_{ui}(1) \neq 0 yui(1)=0 当且仅当 用户看过之后且进行了评分)。 y u i ( 0 ) y_{ui}(0) yui(0) 表示用户 u u u 没看过电影 i i i(一般情况下, y u i ( 0 ) = 0 y_{ui}(0) = 0 yui(0)=0 )。

作者将数据集分成两部分:
(一)曝光数据集(binary,非0即1),具体形式表现为: { a u i , u = 1 , 2 , ⋯   , U , i = 1 , 2 , ⋯   , I } \{a_{ui}, u = 1, 2, \cdots, U, i=1, 2, \cdots, I\} { aui,u=1,2,,U,i=1,2,,I} 用于表示用户是否看过电影。
(二)评分数据集,具体为 { y u i   f o r ( u , i )   s u c h   t h a t   a u i = 1 } \{y_{ui} \ for (u, i)\ \mathrm{such\ that \ a_{ui} = 1 } \} { yui for(u,i) such that aui=1}

推荐系统预测目标应该为 针对 a u i = 0 a_{ui} = 0 aui=0 ( u , i ) (u,i) (u,i),预测 y u i ( 1 ) y_{ui}(1) yui(1) 并推荐影片。即给未交互用户物品对预测评分。

针对上述目标,给出对应的矩阵分解模型如下:
y u i ( a ) = θ u ⊤ β i ⋅ a + ϵ u i , ϵ u i   N ( 0 , σ 2 ) , (1) y_{ui}(a) = \boldsymbol{\theta}_u^\top \boldsymbol{\beta}_i \cdot a + \epsilon_{ui}, \qquad \epsilon_{ui} ~ \mathcal{N}(0, \sigma^2), \tag{1} yui(a)=θuβia

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值