《AutoRec: Autoencoders Meet Collaborative Filtering》WWW2015 阅读笔记

最新推荐文章于 2025-11-14 17:40:41 发布

原创

最新推荐文章于 2025-11-14 17:40:41 发布 · 7.6k 阅读

23 ·

CC 4.0 BY-SA版权

文章标签：

#CF #深度学习 #AE

本文是关于《AutoRec: Autoencoders Meet Collaborative Filtering》的阅读笔记，探讨了如何使用AutoEncoder（AE）应用于协同过滤（CF）。传统CF利用用户评分矩阵预测未知评分，而AutoRec则通过学习用户或物品的向量表示来实现预测。AE旨在重构输入数据，用于特征提取和数据压缩。文章提到，尽管AutoRec思路简洁，但在数据稀疏时可能效果不佳，后续研究通过引入side information改进了这一问题。

前一阵子阅读了部分deep learning结合Collaborative filtering的工作，准备写一系列的阅读笔记，这是作为预热的第一篇，也是最容易的一篇，WWW 2015的poster，看起来很快。

在传统的CF里，所用的信息即为所有用户历史的评分数据，按用户做行，item做列，可以得到一个rating matrix $R$ ，其中Rij指 $user_i$ 对 $item_j$ 的打分。其中我们只能观测到这个矩阵里的部分值，那些未观测到的值则是需要预测的对象。MF解决该问题的思路是将评分矩阵拆成U*V，其中U为user隐向量矩阵，V为item隐向量矩阵。一旦获得 $U^*$ 和V

最低0.47元/天解锁文章

1 条评论

Zero-place 2021.09.01
帅哥，这句话什么意思？"未观测到的missing value在初始时赋一个默认值，比如1-5分的打分体系里统一给3" 是不是下面这段代码，到底有什么意义呀？ [code=python] for user in unseen_user_test_list: for item in unseen_item_test_list: if test_mask_r[user,item] == 1:#如果在测试集中存在这条评分记录，则进行记录decoder[user,item]=3 decoder[user,item] = 3 [/code]

靳晓帅 2018.11.19
博主有没有尝试复现论文呢？我用tensorflow搭建的AE，movielens做数据，发现并跑不出论文中的效果。。。

胖儿里咯噔 2017.04.29
我翻了下KDD15-collaborative deep learning for recommendation systems这篇文章，对motivation那部分又重新看了一遍，在abstract部分发现了一句比较有意思的话，“However, the ratings are often very sparse in many applications, causing CF-based methods to degrade significantly in their recommendation performance....To address this, we generalize recent advances in DL from i.i.d. input to non-i.i.d. input and propose...”。同理，在这篇文章中，引入AE来学得item/user-level的表达，然后再代入CF中还原rating matrix，有点像是给CF一个可靠的先验信息，这个信息是通过item/user之间的相似程度来表示的。在rating matrix稀疏情况下，用来提高推荐的效果。像是数据少，噪声大的问题，可能恰好是这类CF+DL方法所能尝试解决的。可以在相关问题中，尝试使用看看 :-)
- 胖儿里咯噔回复StudyLess 2017.05.02
  [reply]studyless[/reply] 噢噢噢，明白了，我的思想还停留在KDD的那篇文章里，这里原来是提出了两种AutoRec方法，本质上都是只用了DL的方法去做推荐。这和CF+DL的思路还不是同一套:-P
- StudyLess回复胖儿里咯噔 2017.04.30
  [reply]casia_wyq[/reply] 存疑呀，这篇里用AE学出来后，不用再去做矩阵的乘法的了。直接单行或单列输入就可以做还原。是否理解有偏差？