Hu Y, Koren Y, Volinsky C. Collaborative filtering for implicit feedback datasets[C]//2008 Eighth IEEE International Conference on Data Mining. Ieee, 2008: 263-272.
- IF-MF这篇工作也是一篇非常经典的工作,是上一篇论文的同一个作者在ICDM上于2008年发表的。这一篇论文的提出主要是为了处理隐性反馈数据,隐性反馈数据在现实生活中其实是比显性反馈数据要多很多的,所以我们应该去充分的利用这份数据去进行推荐工作,但是目前来说,我们对于隐性反馈数据的利用率不是很高,主要是因为隐性反馈数据并不能和显性反馈数据一样去显性的表示出用户的偏好。
- 但是作者认为隐性反馈数据的数值大小多少能够反映出用户对物品的偏好,比如这篇论文中利用的数据集是作者爬取的一个关于用户看电视节目的这么一个隐性反馈数据集,按照现实的理解,如果数据显示用户观看某一个电视节目1-2次,那么有可能是因为用户喜欢这个电视节目,也很有可能只是因为用户换台的时候经过或者无聊的时候在这个电视节目上做了停留,我们确实不能从这份数据中获取到用户的一个偏好。但是若是用户观看某个电视节目10多次呢?这确实是能够充分体现出用户对这个电视节目的一个喜好程度的!
- 基于此,作者提出了一个叫置信程度的东西,置信程度在这里用C_ui来表示。如果某一条隐性反馈数据能够反映用户偏好的话,则置信程度值会高,否则就会低,而这里的置信程度值完全和隐性反馈值是成正相关的~(正如上面的公式所示 ~)