
因果推断
文章平均质量分 78
夏未眠秋风起
这个作者很懒,什么都没留下…
展开
-
SIGIR‘21因果推断——不要把流行度偏差一棍子打死Causal Intervention for Leveraging Popularity Bias in Recommendation
Causal Intervention for Leveraging Popularity Bias in Recommendationhttps://arxiv.org/pdf/2105.06067.pdf背景本文所提方法针对召回阶段所用方法。之前的工作考虑的是如何缓解流行偏差带来的问题,包括IPS,causal embedding等,而本文考虑的是直接缓解流行偏差而不是流行偏差带来的影响。并且本文考虑到“不是所有流行偏差都是有害的”,流行的item可以反映这个item的趋势和内在特性。而我们..原创 2021-10-08 21:28:34 · 2239 阅读 · 1 评论 -
www21推荐系统之点击原因分解:用户兴趣和一致性(流行度)Disentangling User Interest and Conformity for Recommendation with Cau
Disentangling User Interest and Conformity for Recommendation with Causal Embeddinghttp://staff.ustc.edu.cn/~hexn/papers/www21-dice.pdf背景本文依旧是利用因果推断相关理论进行推荐系统纠偏的一篇文章,相关详细例子可以前往deconfounded中的“举个栗子”进行查看。这里进行简述,作者分析在用户购物的过程中,用户点击某个商品,一方面可能是因为他对这个感兴趣,另一方..原创 2021-10-06 22:24:43 · 1710 阅读 · 0 评论 -
推荐系统(五)——SIGIR‘21用反事实推断缓解点击诱饵,还在为标题党烦躁吗?请看这篇文章
Clicks can be Cheating: Counterfactual Recommendation for Mitigating Clickbait Issuehttps://dl.acm.org/doi/pdf/10.1145/3404835.3462962本文将用到以下相关知识:反事实推断TE、NDE、TIE背景在生活中,无论我们用什么软件(购物、资讯等),都会遇到这样的情况:看到的封面和标题跟点进去的内容不匹配,即标题党。而这些欺骗性的信息会使用户体检变差,而因为用户之前由..原创 2021-10-04 20:36:20 · 1158 阅读 · 0 评论 -
推荐系统(四)——因果效应uplift model系列模型S-Learner,T-Learner,X-Learner
在之前的文章中我们介绍了使用因果推断中的去除混杂和反事实的相关理论来纠正推荐系统中的偏差问题。在这篇文章中主要和大家分享uplift model相关知识和方法。例子小夏的商铺在上次请了明星代言后,销量有所上升,但是他不清楚是不是每个人都对这个明星感冒,有的用户可能没看到广告也打算购买。如果小夏可以给部分用户推送明星代言广告,就可以节约一些成本了(机智的小伙伴可能已经发现了,这里就是一个反事实推断的过程,即如果不展示广告会是什么样呢?)。这里就可以用uplift model来建模。基础知识uplift原创 2021-10-02 16:36:04 · 8939 阅读 · 0 评论 -
推荐系统+因果推断(二)——kdd‘21用反事实推理缓解召回阶段的数据流行度偏差Model-Agnostic Counterfactual Reasoning for EliminatingPopu
Model-Agnostic Counterfactual Reasoning for Eliminating Popularity Bias in Recommender Systemhttps://dl.acm.org/doi/pdf/10.1145/3447548.3467289本文中将会用到因果推断中反事实部分的知识,具体内容可以查看之前的文章,这里就不对反事实相关内容重复叙述了。背景背景和上一篇的背景类似,都是为了解决流行数据偏差问题。想要详细了解例...原创 2021-09-25 12:21:22 · 2702 阅读 · 0 评论 -
推荐系统+因果推断(一)——KDD2021推荐系统中去除混淆缓解偏差放大
今天和大家分享一篇因果推断和推荐系统结合的文章。因果推断在推荐系统中主要应用于用户增长、定价算法以及纠偏等领域,这篇文章属于纠偏领域。主要用到了我们前面因果推断(二)和因果推断(四)中提到的混杂和后门调整等内容,有不熟悉的小伙伴可以翻看前面的文章,好啦,进入正题。背景推荐系统中通常用于学习的数据是不平衡的。由于我们是从用户的历史点击或者转化数据中进行学习,因此通常会面临这样一个问题:对于推荐过的商品我们会认为用户是很感兴趣的,所以很可能会继续给他推荐,而对于没有推荐过的商品,...原创 2021-09-21 19:47:12 · 4800 阅读 · 2 评论 -
因果推断(五)——反事实,后悔药?
反事实推断一个词概括就是“后悔”。例子:“还是以小夏开店为例,小夏请了A明星代言后,销售量虽然有提升,但是由于该明星的代言费很贵,导致最终还是亏本了。于是,小夏想要是当时没有请明星代言,会不会就不亏本了。”——推断没有发生过的事情,就是反事实推断,当前的事实是请了A明星,没有发生的事情是不代言。反事实的定义与计算反事实的计算可以通过干预实现,在外生变量U=u的情况下,假如B=b的话,C的值会是多少。这里对B进行干预do(B=b),则以下面这个因果图为例...原创 2021-09-20 20:43:06 · 3383 阅读 · 1 评论 -
因果推断(四)——后门调整、前门调整、逆概率加权
在因果推断(三)中,我们介绍了干预的相关概念,在本文中,我们对一些方法进行介绍,这些方法可用于利用干预分析变量之间的因果关系。在因果推断(三)中,我们得出了调整公式,如上式。假设PA为A节点的所有父节点的集合,则上式可以修改为其中b为PA所有可能的取值后门调整回顾后门准则的定义:对于X到Y的路径中,如果Z集合中的节点不是X的后代节点,并且以Z为条件会阻断所有X和Y之间的后门路径,则Z满足(X,Y)的后门准则。如果B满足后门准则,则后门调整公式就是我们在...原创 2021-09-15 13:53:20 · 12200 阅读 · 5 评论 -
因果推断(三)——结构因果模型、干预、辛普森悖论
主要内容 结构因果模型 干预 辛普森悖论 调整公式 结构因果模型(Structural Causal Model, SCM)定义:结构因果模型被定义为一个有序三元组<U,V,f>,U为外生变量,即有模型外部因素决定,外生变量不能是其他变量的后代;V为内生变量,即由模型内部因素决定,内生变量至少是一个外生变量的后代;f为一组方程,通过f可以用外生变量推导出内生变量的值SCM包含图结构和变量,简单的例子如下:以因果推断(二)中的诺贝尔奖和巧克力的事原创 2021-09-10 13:42:38 · 7250 阅读 · 4 评论 -
因果推断(二)——混杂因子,D-分离,后门准则
上次已经和大家分享了因果推断中的贝叶斯相关知识,今天这部分和大家分享因果推断中的混杂因子,D-分离,后门准则的相关内容。先上例子以上一篇中的诺贝尔奖和巧克力的事件为例,下图是他们三者的因果图,从图中可以看出这是一个叉式结构,即A和C相关。但是他们的相关性是通过“经济,教育水平”关联的,他们之间是伪相关,而B就是混杂因子,是它造成了A和C之间的伪相关。从字面上也很好理解,是因为B的存在导致我们对A和C之间的因果关系产生了混乱。下图这种形式B也是confunder,即混杂因子。这种情况下,.原创 2021-09-08 12:11:59 · 9867 阅读 · 3 评论 -
因果推断学习笔记(一)
在日常生活中,我们常常会用到因果推断。比如“你淋雨了,赶紧去洗澡,不然容易着凉,感冒”这里我们认为淋雨是感冒的因,通过原因,来推断可能得结果“我拉肚子了,可能是昨天海鲜吃多了”这里我们认为海鲜吃多了是拉肚子的因,并且通过拉肚子反推可能得原因因果推断遍布生活的方方面面,而在大数据时代,因果推断也在机器学习领域逐渐火了起来。要学习因果推断,我们必须先学习一些预备知识。因果性和相关性首先我们需要区分因果性和相关性。相关性:一个比较经典的例子,研究发现一个国家消耗巧克力越多,这个原创 2021-09-05 11:03:40 · 3297 阅读 · 0 评论