该算法最早在文本领域被提出,用于找到文本的隐含语义。核心思想是通过隐含特征(latent factor)联系用户兴趣和物品(item)。是基于机器学习的方法。找出潜在的主题和分类。基于用户的行为对item进行自动聚类,划分到不同类别/主题,即用户的兴趣。
算法实例:假设用户A喜欢的音乐是小清新、吉他伴奏的(即所谓的latent factor),则若一个歌曲(item)含这两个标签就推荐给用户。
一、原始算法(参数:隐特征个数F、学习率a、正则化参数λ、负/正样本比例r)
背景:两个用户A、B的读书列表,由此给用户推荐图书
解决方法:法1:UserCF——给用户推荐和他兴趣相似用户喜欢的书
法2:ItemCF——给用户推荐和他们已看过的书相似的书
法3:基于兴趣分类(LFM)。对于某用户,先得到他的兴趣分类,再从分类中挑选他可能喜欢的物品。
技术点:
1. 如何给物品进行分类?
对于一个用户来说,他们可能有不同的兴趣。就以作者举的豆瓣书单的例子来说,用户A会关注数学,历史,计算机方面的书,用